작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해결된 질문
작성
·
225
1
name, host_name은 둘다 3만이 넘는 고윳값 때문데 삭제하는 건 알겠는데
host_name은 9943개인데 삭제하는 이유를 알 수 있을까요?
latitude, longitude 얘네는 host_name보다 고윳값이 많은데 삭제하지 않는 이유는 수치형 데이터여서 그런가요?
답변 1
네 맞습니다! 첫 모델(베이스라인)은 간단하게 처리하고자 했어요!!
수치형은 그대로 뒀고 특정 피처가 9000개라면 레이블 인코딩 하는 방법도 있겠지만(원핫은 학습속도가 오래걸림) 베이스라인 이후에 시도 해봐도 충분할 것 같아 삭제했습니다 🤔
답변 감사합니다!
네 화이팅입니다!!
답변 감사합니다!