인프런 커뮤니티 질문&답변

jsmak님의 프로필 이미지
jsmak

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

평가 실습 - 피마 인디언 당뇨병 예측

평가 실습 - 피마 인디언 당뇨병 예측

작성

·

175

0

안녕하세요.

수업 중 궁금한 사항이 있습니다.

diabetes_data[zero_features] = diabetes_data[zero_features].replace(0, diabetes_data[zero_features].mean())

이렇게 구현하면 0이 평균에 포함되어서 평균값이 왜곡되지 않는지요?

diabetes_data[zero_features].mean()

 

아래와 같은 식으로 0제외한 값으로 대체 되어야하는것 아닐지요?

diabetes_data[diabetes_data[feature] != 0][feature].mean()

특정한목은 43%나 0값이 있는데, 0을 포함한 평균값이면 평균값이 매우 낮아질것 같아서요.

 

감사합니다.

 

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

음, 말씀하신 부분대로 하는게 보다 더 정확한 평균 값이겠군요.

날카로운 지적, 감사합니다. ^^

jsmak님의 프로필 이미지
jsmak

작성한 질문수

질문하기