작성
·
175
0
안녕하세요.
수업 중 궁금한 사항이 있습니다.
diabetes_data[zero_features] = diabetes_data[zero_features].replace(0, diabetes_data[zero_features].mean())
이렇게 구현하면 0이 평균에 포함되어서 평균값이 왜곡되지 않는지요?
diabetes_data[zero_features].mean()
아래와 같은 식으로 0제외한 값으로 대체 되어야하는것 아닐지요?
diabetes_data[diabetes_data[feature] != 0][feature].mean()
특정한목은 43%나 0값이 있는데, 0을 포함한 평균값이면 평균값이 매우 낮아질것 같아서요.
감사합니다.