인프런 커뮤니티 질문&답변

momgrp24님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

기출(작업형2) 한 가지 방법으로 풀기 🆕 updated 2024.6

전처리시 컬럼삭제에 따른 성능차이 질문

해결된 질문

24.06.13 10:19 작성

·

94

0

예를들어 기출6회 작업형2유형 풀이시에 Heat_Load 를 예측하도록 되어있습니다.

 

예를들어 train 과 test 컬럼에서 nunique 로 값을 확인하고 실제 row수만큼의 빈도수가 발생하는 Cool_Load 값이 있는데요.

 

이 컬럼은 삭제하는것이 더 효율적인 머신러닝 성능이 나오더라구요. 하여 전처리시 컬럼을 삭제처리하는 기준을 nunique 로 임의로 판단해도 될지

 

혹시 강사님은 컬럼삭제의 기준을 어떤식으로 잡는지 궁금합니다. 아니면 그대로 진행하는게 더 나을지 판단이 잘 안서서 질문드려 봅니다.

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 13. 21:28

실제 row수만큼의 빈도수가 발생하는 Cool_Load 값이 있는데요. -> 이정도면 연속형 숫자 아닐까요?? 문자가 맞다면 큰 의미가 없겠네요~

전처리는 기준이 있지는 않아요!

모델 성능을 기준으로 판단하시죠!

momgrp24님의 프로필 이미지

작성한 질문수

질문하기