PYTHON

20221019/25 = 마크다운 / 머신러닝 기초

K.Y.PARK 2022. 11. 3. 16:07

# git = 분산버전관리시스템 / github = 소스코드 관리 + 저장 + 소셜코딩

 

 

 

# 마크다운 = 마크다운을 사용하여 제목이나 내용을 깔끔하게 보여줄 수 있음 / 아래는 참고 사이트

https://docs.github.com/en/get-started/writing-on-github/getting-started-with-writing-and-formatting-on-github/basic writing-and-formatting-syntax

 

Basic writing and formatting syntax - GitHub Docs

Headings To create a heading, add one to six # symbols before your heading text. The number of # you use will determine the size of the heading. # The largest heading ## The second largest heading ###### The smallest heading When you use two or more headin

docs.github.com

 

머신러닝

정답 == label == target

분류로 할 수 있는 일
= Q&A 분류, 메일 분류, 약품 분류 등

회귀로 할 수 있는 일
= 주가 예측, 기온 예측, 강수량 예측, 투표율 예측 등

회귀 알고리즘 중에 분류에 사용할 수 있는 알고리즘?
= 로지스틱 회귀

fit = 학습 / predict = 예측 / evaluate = 평가 

X = feature, 독립변수
y = label, 종속변수

from sklearn.tree import DecisionTreeClassifier 
from sklearn.tree import plot_tree = plot_tree를 시각화해보기

ex ) plt.figure(figsize=(20,20))
ptree = plot_tree(model, max_depth=6, filled=True, fontsize=10)
plt.show()

트리 알고리즘
지니 불순도 = 집합에 이질적인 것이 얼마나 섞였는지를 측정하는 지표이며 CART 알고리즘에서 사용한다.

분류 및 회귀 트리(Classification And Regression Tree, CART)

결측치가 있으면 왜 안될까?
= 결측치가 있으면 인공지능 모델에 학습시킬 수 없다.