작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
당신의 열정을 응원합니다.
해결된 질문
작성
·
191
0
데이터 분리할때 stratify=y 옵션을 강조하는 글을 본적 있습니다. 이렇게 설정하여야 하는 이유가 있나요?
빅분기 실기 시험에서 어떤 효용이 있을까요?
답변 1
stratify=y 는 훈련 데이터와 검증 데이터가 원본 데이터셋의 클래스 비율을 반영하도록 하기 위함이에요~
분류 문제이면서 타겟값이 불균형이 심할 때 유용합니다 🙂
그리고 회귀 문제에는 사용하면 안됩니다.