인프런 커뮤니티 질문&답변

가보자고님의 프로필 이미지
가보자고

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

원핫 인코딩할 때 코드

해결된 질문

작성

·

269

·

수정됨

1

안녕하세요.

강의 잘 듣고 있습니다.

모델링 및 평가(회귀) 강의 + 5회 실기 기출유형 문제풀이 유튜브를 보는데

 

train = pd.get_dummies(train, colmns=cols) ->강의

train =pd.get_dummies(train) ->유튜브

 

이렇게 작성하시더라구요.

결과는 같던데.... 둘 중 아무거나 써도 될까요?

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. pd.get_dummies(train)만써도 됩니다. 판다스에서 알아서 object 타입만 원핫인코딩 해요!

  2. 다만 컬럼을 파라미터로 넣게 되면 제가 원하는 컬럼만 원핫인코딩이 가능해요!! 예를들어 ABCD컬럼중 한 컬럼(D)의 종류(카테고리)가 너무 많아 (많다가 정의된건 아니지만 개인적인 의견으로는 10개 이상이면 저는 많다고 느껴져요) A, B, C 컬럼은 원핫인코딩, D컬럼은 라벨인코딩 할 수도 있고요

응원하겠습니다 :)

가보자고님의 프로필 이미지
가보자고
질문자

감사합니다!

가보자고님의 프로필 이미지
가보자고

작성한 질문수

질문하기