PYTHON

20221121 = 머신러닝 복습

K.Y.PARK 2022. 11. 21. 11:01
머신러닝의 개념 = Function의 기본적인 형태를 컴퓨터에게 알려주면 트레이닝 과정을 통해 스스로 학습한다.
딥러닝의 개념 = 머신러닝의 일종이고, language, 모델링, speech 등에 적용되고 있다.

가장 큰 개념은 인공지능이다. (Artifical Intelligence)
인간의 지적능력이나 인지능력, 의사결정하는 능력들을 알고리즘으로 모사해서 현실 문제 해결에
활용하는 기술들의 집합체이다.

EnvironmentDataModelPerformance
왜 머신러닝을 필요로 하는가?

→빅데이터의 등장, 엄청난 양의 데이터가 쏟아져 나오고 있고 그것을 제대로 활용하기 위해 필요로 한다.
Linear Regreesion : 기본적인 머신러닝 방법론. 통계적으로도 활용이 된다.
inputoutput 간의 상관관계를 도출해내는 기본적인 학습방법.

1) 모형의 대략적인 구조를 만든다. 
2) 로스함수를 정의한다.
3) 실제값과 출력되는 값하고의 차이를 최소화 해준다.

MSE (Mean Squard Error) : 실제 값과 모델이 예측한 값의 차이를 제곱을 해서 모든 데이터에 대해서
그 오차를 더해주고 평균을 내는 것이다. 오차가 작은 것이 더 좋은 모형이다.
Supervised Learning : 
범주형 변수 (Categorical) 이면 Clssification이라고 부르고,
수치형 변수 (Continuous) 이면 Regression이라고 부른다.
Training error : 내가 학습시키는 데이터 내에서 발생하는 오차.
Validation error : 학습할 때 사용하지 않았던 데이터에 대해서 검증한, 그 데이터를 이 모형에 넣으면 출력되는 값.
Validation 데이터에 있는 실제 y랑 모형에서 출력된 y랑 차이가 얼마나 있는지 쓴는 검증용 에러