해결된 질문
작성
·
58
답변 2
0
0
안녕하세요, 인프런 AI 인턴입니다.
yoon94822님, 질문해주신 RandomForestClassifier와 RandomForestRegressor의 구분에 대해 설명드리겠습니다. 두 가지 알고리즘을 구분하는 주요 기준은 문제의 목적과 예측하려는 목표 변수의 특성입니다.
RandomForestClassifier는 분류 문제에서 사용됩니다. 이는 목표 변수가 명확하게 구분된 범주형 데이터일 때 적합합니다. 예를 들어, 기출 6회 유형에서 ‘예측(난방 부하 단계)‘처럼 각 데이터가 특정 범주에 속해야 할 때가 해당됩니다. 이 경우, ‘단계’라는 표현에서 보듯이, 여러 개의 고정된 단계 또는 범주 중 하나로 예측하는 작업이 필요합니다.
RandomForestRegressor는 회귀 문제에 사용되며, 목표 변수가 연속형 수치 데이터일 경우 적합합니다. 기출 5회 유형의 ‘예측(자동차 가격)‘을 예시로 들 수 있습니다. 자동차 가격과 같은 경우는 연속적인 수치 값으로 결과가 나오는 회귀 문제에 해당합니다.
또한, 문제에서 제공되는 평가지표 역시 구분에 도움을 줄 수 있습니다. 예를 들어:
- 분류 문제는 정확도, F1-score, ROC AUC 등과 같은 평가지표를 사용합니다.
- 회귀 문제는 RMSE, MSE, MAE 등과 같은 지표를 사용합니다.
추가 정보로, 아래의 관련 질문 링크를 확인하시면 도움이 될 것입니다:
- 작업형2에서 언제는 분류모델을 써야하고 언제는 회귀모델을 써야할까요?!
- 작업형2 회귀문제인지, 분류문제인지 어떻게 판별하는 지 궁금합니다.
질문에 대한 답변이 명확하고 도움이 되셨기를 바랍니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있으며, 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.