-
카테고리
-
세부 분야
자격증 (데이터 사이언스)
-
해결 여부
해결됨
라이브러리 및 데이터 불러오기 그리고 EDA 데이터 합치기 나누기
24.05.17 18:06 작성 조회수 65
0
라이브러리 및 데이터 불러오기 그리고 EDA 강의를 듣고있는데, 데이터를 나누고 합치는데 그 기준은 무엇인가요? 강의 끝부분에서 x_train, y_train 데이터를 합치고, train 을 x,y 로 나누던데 어떤 기준으로 합치기를 하고 income만 남기고 왜 또 나누는건지 감을 못잡겠습니다. 데이터를 힙치고 나눠야한다는 기준은 어떤 기준을 잡아서 실행해야 할까요?
답변을 작성해보세요.
0
퇴근후딴짓
지식공유자2024.05.18
기준은 train과 test데이터가 제공되고
train은 학습용 데이터, test는 예측해야할 데이터입니다.
각각 X와 y로 나눌 수 있는데 X는 income을 제외한 컬럼 여기서 y가 income에 해당됩니다.
작업형2가 패턴이 있어요. 강의에서 기출포함 10번이상 반복하고 있으니 한 번에 이해가 되지 않더라도 반복하면서 이해해나가보시죠! 💪💪💪
답변 1