인프런 커뮤니티 질문&답변

빅분초보님의 프로필 이미지
빅분초보

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 2번 질문 드립니다.

해결된 질문

작성

·

262

0

안녕하세요. 데이터를 불러오는 것 조차 못하던 제가 지금은 어느 정도 작업을 수행하고 있네요..ㅎ

갑사합니다!!

작업형 2번 concat에 관해 여쭙고 싶은게 있어서 질문드립니다.

  1. train,test (2개의 데이터가 주어진 경우 / train, test 컬럼에서 내용이 다를 때 인코딩)

    • df=pd.concat([train, test],axis=0) 후 인코딩 하고

    • 분리 : train=df[:train,shape[0]].copy()

    • test=df[train,shape[0]:].copy() 이렇게 하는 것은 알고 있습니다.

       

  2. <질문>그러면 데이터가 3개(X_train, Y_train ,test)이렇게 주어진 경우

  • train=pd.concat([X_train, Y_train],axis=1)로 변경하고 작업을 계속 해도 무방한가요?

  • 아니면 다시 분리를 해줘야 하나요? 또 분리를 해야한다면 코드도 궁금합니다!

  • 또한, 위에 1번에서는 axis=0을 한게 컬럼이 동일 하기 때문에 행으로 합친것이고

  • 2번에서 axis=1로 한 것은 옆에다(열 쪽으로) 합쳐야 하기 때문에 그런거겠죠?!

     

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2개가 주어질 것으로 거의 예상됩니다.

3개가 주어졌던 경우 y_train에는 id와 target이 포함되어 있었기 때문에 pd.concat([X_train, Y_train['target']],axis=1)이나 X_trian['target'] = y_train['target']으로 대입해도 됩니다.

빅분초보님의 프로필 이미지
빅분초보

작성한 질문수

질문하기