인프런 커뮤니티 질문&답변

goodgail2247님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

확률값(소수점)을 제출해도 되나요? csv예시랑 달라요! 🆕 updated 2023.11

작업형 2 평가지표 검증관련

해결된 질문

24.06.15 23:04 작성

·

113

·

수정됨

0

  • 작업형2 평가지표 검증하면 나오는 결과값이 강의답안 결과값이랑 다른경우에도 오답이 아니라고 생각하면 될까요?

예를 들어 강의답안은 1411.223 인데, 제 답안의 경우 1399.1234 등으로 타입,소수점 등은 같은데 실제 수치가 다른 경우에요 (같은 모델을 쓴 경우에)

 

같은 데이터셋으로 작업해도 random_state? test_size등 개인의 설정값에 따라 지표값이 달라지는 것인지도 궁금합니다.

답변 3

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 15. 23:47

  1.  

    1411.223 와 1399.1234는 미미한 차이입니다. 전혀 문제 없습니다. 더 좋은 성능이네요 🙂

작업형2는 정답이 있는 문제가 아니에요! 평가지표로 계산해서 구간으로 평가합니다.

 

  1. 네 맞습니다 해당 하이퍼파라미터에 따라 결과가 달라집니다.

0

goodgail2247님의 프로필 이미지
goodgail2247
질문자

2024. 06. 15. 23:19

동일 모델 사용인데 소수점이 아니라 앞자리정수에서 차이가 난다면 1399/1411 등 전처리 등 과정에서 문제가 있다고 생각하고 답안을 재작성해야할까요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 15. 23:49

시험에서는 제 가이드가 없는데 어떻게 하시려고요?? 🙀

정상이고요!

본인 점수 1399가 베이스라인(첫번째 점수) 였다면

이보다 전처리를 통해서 더 줄일 수 있다면 해보시고 안되면 그대로 제출하면 충분합니다.

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 15. 23:06

안녕하세요, 인프런 AI 인턴입니다.

goodgail2247님의 질문에 대해, “작업형2” 평가지표 검증과 관련된 결과값이 강의 답안의 결과값과 다른 경우에 대한 처리 방법에 대해 질문하셨습니다.

이와 관련해 좋은 참고 자료를 발견했습니다. 해당 문의는 작업형2 질문에서 확률 데이터를 구하는 문제에 대해 예시와 자신이 출력한 데이터의 소수점 자릿수 차이가 많이 나는 경우에 대한 처리 방법을 문의한 것과 상당히 유사합니다.

이에 대해 강사님께서는 예측 모델마다 확률값(소수 자리수)의 차이가 있을 수 있으며 이는 정상적인 상황이라고 답변하셨습니다. 모델링 과정에서 발생한 소수점 자릿수 차이는 데이터 처리 과정이나 모델의 세부 설정(예: random_state, test_size 등)에 따라 달라질 수 있음을 의미합니다.

이러한 응답으로 볼 때, goodgail2247님의 경우도 강의 답안과 약간의 결과값 차이가 있더라도, 이는 각 생산 환경에서의 미세한 설정 차이나 모델링 과정에서 발생할 수 있는 일반적인 상황으로 볼 수 있습니다. 따라서 같은 모델을 사용하면서 생긴 작은 결과값의 차이는 오답으로 고려하지 않아도 될 것으로 보입니다. 물론, 모델의 구성이나 데이터 처리 과정에서의 큰 차이가 아닌 경우에 한합니다.

모델링 시 random_state, test_size 등의 설정값에 따라 결과값이 달라질 수 있으멀로, 이러한 매개변수들의 역할과 영향력을 이해하는 것이 중요합니다. 결과값의 차이는 모델의 예측 성능에 영향을 미치는 다양한 요소들에 의해 발생할 수 있음을 인지하시면 좀 더 깊은 분석이 가능할 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.