인프런 커뮤니티 질문&답변

lrs1126님의 프로필 이미지
lrs1126

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

당신의 열정을 응원합니다.

데이터 분리할때 stratify=y 옵션을 적용하는 방법과 효과 등에 대해

해결된 질문

작성

·

332

0

  • 분류 문제에서 학습 데이터와 검증 데이터를 분리할 때 stratify=y 옵션을 사용하는 것을 강조하는 글을 본 적이 있습니다.

  • 반드시 사용하는 것이 좋은가요?

  • 특히 실기시험에서 효용성이 있는지 궁금합니다.

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

stratify=y 는 훈련 데이터와 검증 데이터가 원본 데이터셋의 클래스 비율을 반영하도록 하기 위함이에요~

분류 문제이면서 타겟값이 불균형이 심할 때 유용합니다 🙂

그리고 회귀 문제에는 사용하면 안됩니다.

lrs1126님의 프로필 이미지
lrs1126
질문자

답변 감사합니다!!^^

lrs1126님의 프로필 이미지
lrs1126

작성한 질문수

질문하기