• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

라이브러리 및 데이터 불러오기 그리고 EDA 데이터 합치기 나누기

24.05.17 18:06 작성 조회수 65

0

라이브러리 및 데이터 불러오기 그리고 EDA 강의를 듣고있는데, 데이터를 나누고 합치는데 그 기준은 무엇인가요?  강의 끝부분에서 x_train, y_train 데이터를 합치고, train 을 x,y 로 나누던데 어떤 기준으로 합치기를 하고 income만 남기고 왜 또 나누는건지 감을 못잡겠습니다.  데이터를 힙치고 나눠야한다는 기준은 어떤 기준을 잡아서 실행해야 할까요?

답변 1

답변을 작성해보세요.

0

image기준은 train과 test데이터가 제공되고

train은 학습용 데이터, test는 예측해야할 데이터입니다.
각각 X와 y로 나눌 수 있는데 X는 income을 제외한 컬럼 여기서 y가 income에 해당됩니다.

작업형2가 패턴이 있어요. 강의에서 기출포함 10번이상 반복하고 있으니 한 번에 이해가 되지 않더라도 반복하면서 이해해나가보시죠! 💪💪💪