인프런 커뮤니티 질문&답변

quddkfl963님의 프로필 이미지
quddkfl963

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5-2 작업형 문의

해결된 질문

작성

·

213

1

  1. name, host_name은 둘다 3만이 넘는 고윳값 때문데 삭제하는 건 알겠는데

host_name은 9943개인데 삭제하는 이유를 알 수 있을까요?

 

  1. latitude, longitude 얘네는 host_name보다 고윳값이 많은데 삭제하지 않는 이유는 수치형 데이터여서 그런가요?

 

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 맞습니다! 첫 모델(베이스라인)은 간단하게 처리하고자 했어요!!

수치형은 그대로 뒀고 특정 피처가 9000개라면 레이블 인코딩 하는 방법도 있겠지만(원핫은 학습속도가 오래걸림) 베이스라인 이후에 시도 해봐도 충분할 것 같아 삭제했습니다 🤔

quddkfl963님의 프로필 이미지
quddkfl963
질문자

답변 감사합니다!

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 화이팅입니다!!

quddkfl963님의 프로필 이미지
quddkfl963

작성한 질문수

질문하기