인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

baseline , 라벨인코딩, 원핫인코딩 평가 결과값 다르게

작성

·

21

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

강의 들으면서 코드 똑같이 타이핑해서 결과값 확인 하는데요

 

머신러닝 돌리고 나서

정확도, 정밀도 F1 score, roc-auc 같은 결과값이

강의랑 조금 다르게 나오는데

(예를 들어 강의에서는 baseline 이 라벨인코딩보다 정확도가 더 높은데

제가 코드 돌렸을 때는 라벨인코딩이 조금 높게 나온다던지,,)

 

똑같이 코드를 작성해도 학습했을 때 다르게 나올 수도 있는거죠..? (여러번돌린값X)

random_state 나 test_size 도 강의랑 똑같이 설정했는데도요!

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

삭제된 것으로 보아 궁금증이 해결된 것으로 알겠습니다 🙂

0

안녕하세요, 인프런 AI 인턴입니다.

jnj0713님, 머신러닝 모델을 학습할 때 코드가 똑같이 작성되었음에도 불구하고 결과값이 다르게 나오는 상황에 대해 궁금해 하시는군요. 이는 종종 발생할 수 있는 현상입니다. 주된 이유로는 다음과 같은 것들이 있습니다:

  1. 데이터셋에 내재된 우연성: 데이터셋 자체가 가지는 변동성 때문에 같은 코드라도 결과가 다르게 나타날 수 있습니다. 데이터의 분할이 미세하게 다를 때 모델이 학습하는 패턴도 달라질 수 있습니다.

  2. 랜덤 초기화: 알고리즘의 초기화가 랜덤적으로 설정되는 경우, 이를 통제하지 않으면 매번 다른 결과가 나올 수 있습니다. 이미 랜덤 시드를 설정하셨지만, 특정 구현이나 라이브러리에 따라 다른 요소가 영향을 미칠 수 있습니다.

  3. 내부 알고리즘 차이: 사용하시는 라이브러리나 환경에 따라 내부적으로 알고리즘이 처리되는 방식에서 미세한 차이가 있을 수 있습니다.

아래와 같은 유사한 질문에서 추가로 참고하실 수 있을 겁니다:
- 이 두가지 방법의 코딩 결과값이 왜 다른가요??!
위 게시물에서는 기본 파이썬 함수를 이용하여 직접 계산할 때 부동소수점 계산 등에 따른 차이를 설명하고 있습니다.

이러한 경우, 일반적인 수치는 큰 차이가 나지 않도록 설계되어 있으나, 미세한 수치 차이가 있을 수 있음을 감안하시고, 검증하고자 하는 로직의 흐름을 간과하지 않으셨다면 문제없이 잘 진행되고 있는 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기