해결된 질문
작성
·
272
답변 1
0
이렇게 코딩할 수 있어요💪
train 데이터 길이는 shape이나 len으로 확인할 수 있고
데이터를 나눌때는 아래와 같이 작업하거나 loc/iloc를 활용할 수도 있어요!
combined = pd.concat([train, test]) # 데이터 합치기
combined_dummies = pd.get_dummies(combined) # 원핫 인코딩
n_train = len(train) # train길이 확인
train = combined_dummies[:n_train] # train데이터 나누기
test = combined_dummies[n_train:] # test데이터 나누기
test = test.drop('target', axis=1) # test데이터에 target컬럼 제거
감사합니다!