인프런 커뮤니티 질문&답변

wanzy123님의 프로필 이미지
wanzy123

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출 유형(작업형2)

4회 기출 유형(작업형2) 15:15 질문드립니다.

해결된 질문

작성

·

105

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

범주형 데이터에 대한 원핫인코딩을 진행할 때

cols=train.select_dtypes(include="O").columns
train=pd.get_dummies(train,columns=cols)로 진행해야 하진 않나요?

train=pd.get_dummies(train)이어도 범주형만 알아서 찾아서 원핫인코딩을 진행 해주나요?

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 맞습니다.

train=pd.get_dummies(train) 만해도

자동으로 범주형 데이터만 선택해서 인코딩합니다!

 

 

이전에

cols=train.select_dtypes(include="O").columns
train=pd.get_dummies(train[cols])로 했던건

작업형2 난이도가 올라갈 것을 대비해 특정 컬럼은 원핫, 특정 컬럼은 레이블을 염두한 상태였어요~

그런데 작업형2는 40점 난이도가 높지 않아 일괄 적용해도 그동안 아무런 문제가 없었어요

쉬운방법으로 pd.get_dummies(train) 한 번에 처리 하시죠!

wanzy123님의 프로필 이미지
wanzy123
질문자

선생님 전 사나이 답게 cols 사용하겠습니다. 쉬운 길로 갈 생각하니 제 자존심이 허락하지 않는군요..

이겨내겠습니다.

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

아닙니다.

train=pd.get_dummies(train) 저도 이렇게 사용합니다.

사나이 답게 이렇게 가시죠!!! 지금 아직 갈 길이 한 참 남았어요!! 더 분발하시죠!!

wanzy123님의 프로필 이미지
wanzy123

작성한 질문수

질문하기