인프런 커뮤니티 질문&답변

익명님의 프로필 이미지
익명

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글 개 나이 예측 문항

해결된 질문

작성

·

65

0

안녕하세요!

작업형 2번 관련해서 질문 드려도 괜찮을까요…?

혹시 get dummies 하기 전에 데이터 합치고 나눠야만 하나요..?

수치형 데이터로 구성되어있고, 컬럼 같을 경우에는 합치고 나누는 작업 없이 get dummies 진행했는데 다른 풀이하고 결과값이 조금 차이 나는 것 같아서요!

Get dummies 전후로 데이터 합치고 나누는 이유를 알고 싶습니다!

제 코드

# print(train.shape, test.shape)

train = pd.get_dummies(train)

test = pd.get_dummies(test)

# print(train.shape, test.shape)

다른 분들 모범 코드입니다¡

data = pd.concat([train,test])

data = pd.get_dummies(data)

train = data.iloc[:len(train)]

test = data.iloc[len(train):]

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

아마도 카테고리가 다를 경우를 대비해 합쳐서 인코딩하는 것으로 무조건 준비하는 분들이 계세요~

그 경우인 것 같습니다 🙂

꿀팁 "인코딩 할 때 에러가 난다면?" 영상참고

익명님의 프로필 이미지
익명

작성한 질문수

질문하기