인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

[개정판] 파이썬 머신러닝 완벽 가이드

학습과 테스트 데이터 세트의 분리

DecisionTreeClassifier 객체의 random_state 값

해결된 질문

작성

·

166

0

의사 결정 트리 클래스 DecisionTreeClassifier 객체를 생성할 때 코드가

dt_clf = Decision_TreeClassfier(random_state=11)

이렇게 되던데요, random_state 값이 왜 파라미터로 필요한지 궁금해요. 이 객체는 이후에 학습 데이터 와 테스트 데이터를 받아서 학습과 예측을 수행하잖아요?? 이 과정에서 학습 데이터와 테스트 데이터가 어떻게 분리되었는지는 알 필요가 없는데 이 값이 왜 들어가나요???

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

DecisionTreeClassifier에서 사용된 random_state값은 Decision Tree 알고리즘에서 tree 분할 시 random하게 알고리즘이 수행되는 부분에 대해서 고정된 random값을 부여하기 위함입니다. 굳이 안써도 됩니다만, 이게 강의다 보니까, 동일한 결과를 DecisionTree 학습시마다 발생 시키기 위해서 사용한 것입니다. 데이터를 나누는 train_test_split()에 들어가는 random_state하고는 다른 random_state입니다.

감사합니다.

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기