인프런 커뮤니티 질문&답변

reverq님의 프로필 이미지
reverq

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출 유형(작업형2)

작업형 2 모델링 기법 선정

해결된 질문

작성

·

41

0

안녕하세요! 작업형2에서 모델링을 선택할때 여러가지 모델을 모두 사용해보고 스코어가 가장 높을 것을 선택해서 제출하는 것으로 이해했습니다!

그렇다면 그 여러가지 모델을 선정해야하는데 어떤 모델을 선정해야할까요?

분류/회귀에 따라 다른 것으로 알고 있는데 분류/회귀 각각 3~4개정도 추천해주실 수 있으신가요?

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. 랜덤포레스트 분류/회귀 (가장 무난합니다.)

  2. LightGBM 분류/회귀

  3. 여유가 있다면 xgboost 분류/회귀

정도 준비해서 가시죠!!

0

안녕하세요, 인프런 AI 인턴입니다. reverq님 질문에 감사드리며, 작업형 2에서의 모델 선택에 대한 조언을 드리고자 합니다.

작업형 2에서 선택할 모델은 문제의 특성에 따라 회귀 모델과 분류 모델을 다르게 사용해야 합니다. 일반적으로 데이터의 타겟 변수(종속 변수)가 연속적인 값을 예측하는 경우 회귀 모델을 사용하고, 범주형 변수를 예측하는 경우 분류 모델을 사용합니다.

회귀 모델 추천:

  1. 선형 회귀 (Linear Regression): 기준선으로 비교하기 좋은 기본적인 모델입니다.
  2. 릿지 회귀 (Ridge Regression)라쏘 회귀 (Lasso Regression): 규제를 통해 모델의 복잡도를 조절할 수 있습니다.
  3. 랜덤 포레스트 회귀 (Random Forest Regressor): 비선형 관계가 있는 데이터를 잘 처리합니다.
  4. XGBoost Regressor: 강력한 성능을 자랑하는 부스팅 방식 회귀 모델입니다.

분류 모델 추천:

  1. 로지스틱 회귀 (Logistic Regression): 분류 문제에 대한 기본 선형 모델입니다.
  2. K-최근접 이웃 (K-Nearest Neighbors, KNN): 간단하지만 효과적인 분류 알고리즘입니다.
  3. 서포트 벡터 머신 (Support Vector Machine, SVM): 고차원 공간에서 분류를 수행하는데 적합합니다.
  4. 랜덤 포레스트 (Random Forest Classifier)XGBoost Classifier: 복잡한 데이터에서도 강력한 성능을 보여줍니다.

이와 같은 모델들을 사용하여 각각의 성능을 객관적으로 비교한 후, 가장 높은 평가 지표를 보이는 모델을 선택하여 제출하는 것이 이상적입니다. 각 모델의 평가 기준 또한 분류와 회귀에 따라 다르므로 주어진 문제의 평가 지표에 맞춰 모델 성능을 평가하시면 됩니다.

관련 질문 참조:

비슷한 내용의 질문으로 “작업형2에서 언제는 분류모델을 써야하고 언제는 회귀모델을 써야할까요?!”를 참고하실 수 있습니다. 해당 질문에서 모델의 특징에 따른 적절한 선택 기준에 대한 더 세부적인 설명을 제공하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

reverq님의 프로필 이미지
reverq

작성한 질문수

질문하기