해결된 질문
작성
·
76
0
안녕하세요!
작업형 2번 관련해서 질문 드려도 괜찮을까요…?
혹시 get dummies 하기 전에 데이터 합치고 나눠야만 하나요..?
수치형 데이터로 구성되어있고, 컬럼 같을 경우에는 합치고 나누는 작업 없이 get dummies 진행했는데 다른 풀이하고 결과값이 조금 차이 나는 것 같아서요!
Get dummies 전후로 데이터 합치고 나누는 이유를 알고 싶습니다!
제 코드
# print(train.shape, test.shape)
train = pd.get_dummies(train)
test = pd.get_dummies(test)
# print(train.shape, test.shape)
다른 분들 모범 코드입니다¡
data = pd.concat([train,test])
data = pd.get_dummies(data)
train = data.iloc[:len(train)]
test = data.iloc[len(train):]
답변 1
0
아마도 카테고리가 다를 경우를 대비해 합쳐서 인코딩하는 것으로 무조건 준비하는 분들이 계세요~
그 경우인 것 같습니다 🙂
꿀팁 "인코딩 할 때 에러가 난다면?" 영상참고