인프런 커뮤니티 질문&답변

joonpark402님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

자주 활용되는 파이썬 예제

[섹션4_작업형2_모델링 및 평가(분류, 회귀)] 값이 다른 경우

해결된 질문

24.06.01 11:18 작성

·

63

0

  • 평가 데이터 분할 시 random_state를 예제와 동일하게 2022로 지정 후에 의사결정나무, 랜덤포레스트, XGBoost가 포함된 각 셀을 실행하면 강의 시 설명한 예제 pred[:10]과 값이 제가 직접 실행한 값과 다를 수 있는가요?
    • 특히, 의사결정나무와 랜덤포레스트는 여러 번 실행하면 roc_auc_score 값이 계속 변경되는데 미세한 차이로 변경되어 채점 시 불이익 없는지도 궁금합니다.
 
  • 아래와 같이 재실행 시 값이 변경되는 알고리즘을 정리했는데 맞는지 확인 부탁드립니다
    • 재실행 시 값 변경
      • 분류
        • DecisionTreeClassifier
        • RandomForestClassifier
      • 회귀
        • RandomForestRegressor
        •  
    • 재실행 시 값 변경 X
      • 분류
        • XGBClassifier
      • 회귀
        • LinearRegression
        • XGBRegressor

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 01. 23:14

  1. 강의와는 예측값이 다를 수 있습니다.

  2. 미세한 차이는 있을 수 있으며 보통은 같은 환경에서 random_state을 고정하면 동일한 결과가 나옵니다.모델은 random_state를 고정했지만 데이터를 나눌때도 random_state를 고정했을까요?

     


    미세한 차이는 크게 신경쓰지 않으셔도 됩니다!