인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

yaejin1016님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

3회 기출유형(작업형2)

model fit 할 때 unknown label 오류

작성

·

51

1

강의에서 나온 내용 중 pd.get_dummies를 제외하고 동일하게 했는데 RandomForestClassifier로 모델링을 하려고 하니 아래와 같은 오류가 나타납니다 : Unknown label type: unknown. Maybe you are trying to fit a classifier, which expects discrete classes on a regression target with continuous values.

답변 2

1

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다. yaejin1016님.

주어진 오류는 Unknown label type: unknown으로, 이는 주로 분류 모델을 연속적인 값(target)에 대해 학습시키려고 할 때 발생합니다. RandomForestClassifier는 일반적으로 범주형 데이터(이산값)를 예상합니다. 하지만 연속적인 값을 주게 되면 이와 같은 오류가 발생할 수 있습니다.

문제 해결 방안

  1. 타겟 값 확인: target 변수 또는 라벨이 올바르게 이산값(범주형)인지 확인합니다. 수치값인데 분류 문제로 설정된 경우 astype('category') 등을 통해 범주형으로 변환할 수도 있습니다.
  2. 모델 선택: 만일 학습하려는 문제가 회귀 문제라면 RandomForestRegressor를 사용해야 합니다. 회귀 모델은 연속적인 target을 예측하기 위해 설계되었습니다.

아래는 동일한 문제를 해결했던 유사한 질문과 답변입니다:
- “ValueError: X has 11 features, but DecisionTreeClassifier is expecting 10 features as input”: 모델 입력의 형식 에러에 관한 질문으로, 데이터셋의 컬럼 맞춤과 관련된 문제 해결 방법을 제시합니다.
- “The feature names should match those that were passed during fit”: 예측시 test 데이터셋과 train 데이터셋의 특성 이름 불일치 문제를 다룹니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

기출 3은 "회귀"문제입니다.

회귀 모델을 사용해 주셔야해요 🙂
- 회귀: RandomForestRegressor
- 분류: RandomForestClassifier

yaejin1016님의 프로필 이미지
yaejin1016
질문자

엇 근데 이 문제는 분류 문제 아니었나요....??? y_test 보면 0,1로 되어 있어서 분류 문제라고 생각했습니다...!

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

제가 문제를 착각했네요 기출 3분류 맞아요!

겟더미를 사용하지 않았다면 문자 컬럼은 삭제했을까요?!

문자(object) 컬럼은 인코딩 또는 삭제가 필요합니다:)

인코딩 하는 부분은 반드시 필요해요 :)