인프런 커뮤니티 질문&답변

hhhse님의 프로필 이미지
hhhse

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

2회 기출유형(작업2)

해결된 질문

작성

·

140

0

모델 평가 부분에서 XGBOOST의 결과가 강의에서는 0.73709로 나오는데 저는 이와 다르게 0.7264 로 나옵니다.

random_state = 2022 로 강의와 똑같이 설정한 경우에도 다른 값이 출력되기도 하나요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네, ai 인턴도 설명했지만 다를 수 있어요 🙂

이 정도는 문제가 없습니다.

작업형1과 3은 정답이 있는 문제로 값의 차이가 있으면 안됩니다.

작업형2는 평가 지표로 평가를 하고 있어요 🙂 수험생 대부분이 조금씩 차이가 있습니다!

응원하겠습니다.

 

0

안녕하세요, 인프런 AI 인턴입니다.

hhhse님의 질문은 XGBoost 모델의 결과가 강의에서 제시된 값과 다르게 나오는 경우에 대한 것이며, 이는 모델 학습 과정에서 자주 발생할 수 있는 현상입니다.

다양한 요소가 모델의 최종 결과에 영향을 미칠 수 있으며, random_state 값을 고정했다 하더라도 데이터의 분할 방식, 데이터 전처리 과정, 모델의 하이퍼파라미터, 라이브러리의 버전 차이 등 다른 요소들이 결과의 차이를 일으킬 수 있습니다.

XGBoost 모델의 성능 차이에 대해 질문하셨고, 이와 유사한 문제를 다루고 있는 강의 내용에 대한 링크를 찾았습니다. 여기서는 XGBoost 모델링 시 나타날 수 있는 일반적인 문제와 그 해결 방법에 대해 설명하고 있습니다:

  • 기출유형작업과 유사한 질문으로, XGBoost 모델 결과에 영향을 미칠 수 있는 요소에 대한 설명이 포함된 링크:
    • 3-5 roc_auc_score 적용 값 관련(3가지 모델 동일 정확도)에서는 XGBoost를 포함한 여러 모델의 roc_auc_score 값이 동일하게 나오는 현상을 다루고 있습니다. 이 답변에서는 모델 예측 결과를 어떻게 처리해야 하는지, 예측 결과가 어떻게 roc_auc_score에 반영되는지 등을 설명하고 있습니다.

이 경우와 유사하게, 모델의 출력값에 대한 해석이나 모델 성능 평가 방법에 대한 이해가 전반적으로 도움이 될 수 있습니다. 모델 결과가 예상과 다를 때는 데이터 전처리 방법, 모델 파라미터 설정, 평가 방법 등을 다시 한번 확인하는 것이 좋습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

hhhse님의 프로필 이미지
hhhse

작성한 질문수

질문하기