Logistic Regression
- Classification Task에 쓰이는 모델이다.
- 로지스틱 회귀는 일반적인 회귀 분석의 목표와 동일하게 종속 변수와 독립 변수 간의 관계를
구체적인 함수의 형태로 나타내어 향후 예측 모델에 사용한다.
- 독립 변수의 선형 결합으로 종속 변수를 설명한다는 점에서 선형 분석과 유사하지만,
로지스틱 회귀는 선형 회귀 분석과 다르게 종속 변수가 범주형 데이터를 대상으로 하며
입력 데이터가 주어졌을 때, 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류기법으로 볼 수 있다.
- 로지스틱 회귀는 선형회귀와 달리 0과1로 수렴하는 S자형으로 그려지게 되는데,
이 때 사용되는 것이 sigmoid함수이다. 이 함수는 0과1 사이의 값을 표현해준다.
로지스틱 회귀분석 장점
- 종속 변수와 독립 변수 사이의 관계가 비선형 관계로 식별되기 때문에 정규 분포의 가정이 독립 변수에
적용되지 않는다.
- 명목형, 순서형, 연속형 등 다양한 독립 변수에 자료 유형을 사용할 수 있기 때문에 복잡한 현상을 설명할 수 있다.
Neural Network
- 신경망은 input이 들어오면, 매겨변수인 가중치와 내적되고, 편향이 더해짐으로 다음 레이어로 진행한다.
다음 레이어로 진행하면 활성화 함수를 통해 이 노드를 활성화시킬 것인지 아닌지를 결정한다.
다시 가중치를 내적하고 편향을 더해줄 지, 아닐지를 결정하여 진행하는 방식이다.
- 신경망은 훈련 데이터에 의존하여 시간이 지남에 따라 정확도를 학습하고 계산한다.
이러한 학습 알고리즘이 정확성을 위해 미세 조정되면 컴퓨터 과학 및 인공 지능의 강력한 도구가 되어
데이터를 고속으로 분류하고 클러스터링할 수 있다.
신경망 사용의 예
- 시계열 예측, 알고리즘 거래
- 증권 분류, 신용 위험 모델링, 파생 상품 구성 등
- 그 외에도 재무 운영, 기업 계획, 제품 유지 관리 등 광범위하게 이용되고 있음.
신경망의 작동 방식?
- 출력 = f(x) = 1 if ∑w1x1 + b>= 0; ∑w1x1 + b < 0인 경우 0
- 입력 레이어가 결정되면 가중치가 할당된다. 가중치는 주어진 변수의 중요성을 결정하는 데 도움이 되며,
더 큰 변수는 다른 입력에 비해 출력에 더 크게 기여한다. 그런 다음 모든 입력에 해당 가중치를
곱한 다음 합산하게 된다. 해당 출력이 주어진 임계값을 초과하면 노드를 실행하여 데이터를 네트워크의
다음 레이어로 전달한다. 한 노드의 출력이 다음 노드의 입력값이 된다는 얘기이다.
신경망의 유형
- Feed-Forward Neural Networks
- Recurrent Neural Networks
- Convolutional Neural Networks
- Deconvolutional Neural Networks
- Modular Neural Networks
신경망의 장점
- 지속적으로 작동할 수 있고, 사람이나 단순한 분석 모델보다 더 효율적인 중립 네트워크이다.
- 로컬 기술 하드웨어에 의존하는 시스템에 비해 위험 완화의 이점도 있다.
신경망은 종종 여러 작업을 동시에 수행할 수 있다.
신경망의 단점
- 신경망을 만드는 데 필요한 하드웨어 구성 요소가 여전히 있다. 이로 인해 복잡한 시스템,
설정 요구 사항 및 네트워크의 물리적 위험이 발생할 수 있다.
- 코드 및 알고리즘을 개발하는 데 오랜 시간이 걸릴 수 있다.
- 일반적인 범위 밖 범위를 예측할 수도 있다.