인프런 커뮤니티 질문&답변

HAHA님의 프로필 이미지
HAHA

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

배깅(Bagging)과 랜덤 포레스트(Random Forest)의 이해

배깅 질문드립니다!

작성

·

187

0

안녕하세요

강의 1:31분에서 서브세트 #1~N을 100K로 나누시던데

전체가 100K이고 서브세트에 100K로 넣으면

같은 데이터셋으로 전체가 학습하는거 아닌가요...?

 

항상 좋은 강의 감사드립니다!

답변 1

1

HAHA님의 프로필 이미지
HAHA
질문자

위에 내용은 5분에서 설명해주셔서 이해했습니다!

근데 중복 데이터로 학습시키면 오버피팅 위험은 없을까요?

권 철민님의 프로필 이미지
권 철민
지식공유자

중복 부분이 생각 보다 많지는 않습니다. 그리고 많은 weak learner가 오버 피팅을 개선해 줍니다. 

HAHA님의 프로필 이미지
HAHA

작성한 질문수

질문하기