인프런 커뮤니티 질문&답변

이다영님의 프로필 이미지
이다영

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

rmse(np.exp(y_val),no.exp(pred)) 작업시 나오는 에러메세지 해결 방법

해결된 질문

작성

·

268

0

  • rmse를 진행하는 부분에서
  • rmse(y_val,pred) 라고 진행하면 문제가 없으나
  • 후에 y값에 들어갈 charges 컬럼 데이터에 로그를 씌워 단위 변환한 평가값과 비교하기 위해
  • 기존 데이터 평가에 rmse(np.exp(y_val),np.exp(pred))를 씌워보면
  • Found input variables with inconsistent numbers of samples: [161, 268]
  • 혹은
  • Input contains infinity or a value too large for dtype('float64').
  • 와 같은 에러가 뜹니다. 혹시 제가 어떤 작업을 놓친 걸까요?

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  • Found input variables with inconsistent numbers of samples: [161, 268]

우선 pred결과가 검증데이터의 결과가 맞는지 확인이 필요할 것 같아요
검증(val) 데이터는 평가가능하지만 실제 제출용(test)데이터는 자체 평가가 불가능합니다.
len(y_val), len(pred)과 크기를 한번 확인해주세요!


Input contains infinity or a value too large for dtype('float64').

값이 너무 커져서 이런 상황이 나타난 것 같아요. 로그 적용 부분이 의심됩니다.
로그 적용은 필수가 아니라 심화 학습이에요! 기출까지 본 후 학습해도 됩니다.

train['charges'] = np.log1p(train['charges'])


이다영님의 프로필 이미지
이다영

작성한 질문수

질문하기