작성한 질문수
[개정판] 파이썬 머신러닝 완벽 가이드
학습과 테스트 데이터 세트의 분리
작성
·
131
0
실전에서표본인 학습데이터와 테스트 데이터를 뽑을때 모집단의 특성(parameter)를 대표하는지 검증을 해야하는지 궁금합니다.
답변 2
충분히 답변이 된것 같습니다 감사합니다.
안녕하십니까,
검증을 하면 좋을 것 같습니다.
하지만 보통 머신러닝 프로젝트 시에는 검증까지는 아니고, 학습 데이터/테스트 데이터 뽑을 때는 주로 Target 값의 분포도와 주요 feature 들의 값 분포도를 기반으로 학습/테스트 데이터를 맞추려고 노력합니다.
전체 데이터의 Target과 주요 feature들의 값 분포도에 맞게 보통 추출하려고 노력합니다.
감사합니다.