인프런 커뮤니티 질문&답변

crystal님의 프로필 이미지
crystal

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

y_train 의 값

해결된 질문

작성

·

86

0

train_test_split() 함수내에서 y_train 을 나누는 방법에 차이가 있는 이유가 무엇일까요?00.JPG첫번째 사진은 y_train['Reached.on.Time_Y.N'] 으로 했고 열에 값이 출력되지 않았는데,11.JPG두번째 사진은 y_train.drop('ID', axis=1) 로 했는데 열값이 1이 나왔습니다. 두 방법 모두 결국에는 y_train에서 'Reached.on.Time_Y.N' 만 남기는 것은 동일한데 왜 열값의 출력이 다른지 궁금합니다.

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

두번째 방식은 2개의 컬럼의 데이터프레임에서 1개의 컬럼을 제거하더라도 여전히 데이터프레임입니다.

첫번째 방식은 1개의 컬럼을 선택했기 때문에 시리즈 형태로 정상적으로 들어갔고요!

따라서 데이터프레임 형태로 입력되면 1이라는 값이 나타나게 되고, 나중에 모델 학습할 때 오류가 발생할 수도 있으니 시리즈 형태로 입력하는 것이 맞아요!

crystal님의 프로필 이미지
crystal

작성한 질문수

질문하기