작성자 없음
작성자 정보가 삭제된 글입니다.
해결된 질문
작성
·
166
0
의사 결정 트리 클래스 DecisionTreeClassifier 객체를 생성할 때 코드가
dt_clf = Decision_TreeClassfier(random_state=11)
이렇게 되던데요, random_state 값이 왜 파라미터로 필요한지 궁금해요. 이 객체는 이후에 학습 데이터 와 테스트 데이터를 받아서 학습과 예측을 수행하잖아요?? 이 과정에서 학습 데이터와 테스트 데이터가 어떻게 분리되었는지는 알 필요가 없는데 이 값이 왜 들어가나요???
답변 1
1
안녕하십니까,
DecisionTreeClassifier에서 사용된 random_state값은 Decision Tree 알고리즘에서 tree 분할 시 random하게 알고리즘이 수행되는 부분에 대해서 고정된 random값을 부여하기 위함입니다. 굳이 안써도 됩니다만, 이게 강의다 보니까, 동일한 결과를 DecisionTree 학습시마다 발생 시키기 위해서 사용한 것입니다. 데이터를 나누는 train_test_split()에 들어가는 random_state하고는 다른 random_state입니다.
감사합니다.