X_train, X_test,y_train, y_test= train_test_split(iris_data.data, iris_<a target="_blank" rel="noopener noreferrer nofollow" href="http://data.target">data.target</a>, test_size=0.3, random_state=121) 를 이용해서 데이터를 분류하는데 이때 X_test, X_train이 학습용 피쳐값인지 테스트용 피쳐값인지 구분을 하는 메커니즘이 뭘까요? 위치로 구분을 하는 것인가요??

안녕하십니까, 네 맞습니다. 위치로 구분을 합니다. train_test_split() 호출 시 반환이 tuple 형태로 되는데, 첫번째 위치의 값이 학습 feature 데이터, 두번째 위치의 값이 테스트 feature 데이터, 세번째 위치의 값이 학습 타겟 데이터, 마지막 위치의 값이 테스트 타겟 데이터 입니다. 감사합니다.

인프런 커뮤니티 질문&답변

데이터 분류과정에서 코드 질문