작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
당신의 열정을 응원합니다.
해결된 질문
작성
·
332
0
분류 문제에서 학습 데이터와 검증 데이터를 분리할 때 stratify=y 옵션을 사용하는 것을 강조하는 글을 본 적이 있습니다.
stratify=y
반드시 사용하는 것이 좋은가요?
특히 실기시험에서 효용성이 있는지 궁금합니다.
답변 1
1
stratify=y 는 훈련 데이터와 검증 데이터가 원본 데이터셋의 클래스 비율을 반영하도록 하기 위함이에요~
분류 문제이면서 타겟값이 불균형이 심할 때 유용합니다 🙂
그리고 회귀 문제에는 사용하면 안됩니다.
답변 감사합니다!!^^
답변 감사합니다!!^^