인프런 커뮤니티 질문&답변

이민규님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2 평가

해결된 질문

24.06.10 10:24 작성

·

118

·

수정됨

0

제 기준에서는 baseline (단순 object 제거)으로 했을 때

점수가 가장 높았습니다.

 

질문

 

  1. 강사님은 레이블 인코딩일 때 auc 점수가 가장 높던데

     

    학습 데이터가 동일하더라도 평가 점수는 다를때가 많나요?

     

  2. 문제에서 auc 등 어떤 지표를 기준으로 평가하는지 명시해주나요? 그러면 그 평가 지표가 가장 높은 피처 엔지니어링 방법으로 진행하면 될까요?

  3. 수치형 데이터 스케일링은 진행 안 하신 이유가 궁금합니다.

답변 2

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 10. 19:08

  1. 네~ 약간은 다를 수 있습니다.

  2. 평가지표는 명확하게 명시해 주고 있어요! 맞습니다. 그 평가지표를 기준으로 가장 성능이 좋은 모델을 만들면됩니다. (만약 모르는 평가지표가 나왔다면 어쩔수 없이 회귀, 분류 중 아는 평가지표를 사용하시죠)
    3. 인코딩은 필수이지만 수치형 데이터 스케일링은 선택!!입니다. 랜덤포레스트와 같은 트리 형태의 모델을 사용할 경우 효과가 미미하기도 합니다.

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 10. 10:26

안녕하세요, 인프런 AI 인턴입니다. 이민규님의 질문에 대해, 비슷한 맥락의 질문과 답변을 찾아봤습니다. 이민규님의 질문은 작업형2 평가에 관련되어 있으며, 강의 수강생들이 유사한 고민을 한 흔적이 있습니다. 다음 내용을 참조하시면 도움이 될 것 같아요.

  1. 평가 점수가 달라질 수 있는지에 대한 질문:

    • 이와 관련해서는, 작업형 2 모델학습 질문에서 모델을 학습하는 다양한 방법을 논의하는 과정에서, 데이터의 전처리 방식(인코딩 포함)이나 모델에 따라 평가 지표가 달라질 수 있음을 시사하는 답변이 있었습니다. 이러한 답변은 평가 점수가 다른 경우를 정상으로 보고, 특정 인코딩 방식 또는 모델 선택이 결과에 영향을 줄 수 있음을 이해하는 데 도움이 될 것입니다.
  2. 특정 지표에 따른 평가의 명시 여부:

    • 빅데이터 분석기사 (2회): 기출유형-작업형2 질문에서는 구체적으로 어떤 평가 지표를 사용할지에 대한 직접적인 언급은 없습니다. 하지만, 실제 시험에서는 주로 AUC, 정확도(Accuracy) 등의 기준으로 모델을 평가하는 경우가 많으멀로, 문제에서 요구한 평가 지표가 있다면 그것을 기준으로 최적의 피처 엔지니어링 및 모델을 선택하는 것이 바람직합니다.
  3. 수치형 데이터 스케일링을 진행하지 않은 이유:

    • 이에 대한 구체적인 답변은 제공되지 않았지만, 일반적으로 모델의 종류(특히 트리 기반 모델 같은)에 따라 데이터 스케일링의 필요성이 달라질 수 있습니다. 이와 관렘해서는 작업형 2 모델학습 질문에서 범주형 인코딩과 수치형 데이터 스케일링을 함께하는 방법이 논의되기도 했습니다. 각기 다른 스케일링 방법을 사용함으로써 모델의 성능에 어떠한 차이가 있는지 이해하는 것이 중요합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.