PYTHON

20221116 = Boosting tree 간단정리

K.Y.PARK 2022. 11. 17. 16:15

Boosting Tree

 

BaggingBoosting의 차이?

 

→Bagging : 데이터 셋 모델마다 독립적, 병렬적, 훈련세트에서 중복을 허용해서 샘플링하여 여러개 모델을 훈련 하는 앙상블 방식

→Boosting : 앞 모델이 데이터 셋을 정해준다, 직렬적, 약한 모델을 여러개 연결해서 강한 모델을 만들어 내기 위한 앙상블 방식

→Epoch = 학습횟수를 의미한다. ( = n_estimators )

 

 

성능에 고려 없이 GBM에서 훈련시간을 줄이기 위해서는?

 

→Learing_rate을 올려 사용한다.

 

GBM (Gradient Boosting Tree) 은 랜덤 포레스트와 다르게 무작위성이 없다.

 

순차적으로 데이터를 추출하기 때문이다.

 

GBM의 특징?

 

데이터의 스케일에 구애받지 않는다.

매개변수를 잘 조정해야 하고 훈련 시간이 길다.

고차원의 희소한 데이터에 잘 작동하지 않는다.

 

출처 : 멋쟁이사자처럼 AI7기 강의자료