해결된 질문
작성
·
105
·
수정됨
0
전 강의 분류에서 랜덤포레스트 모델 불러올 때는
model = RandomForestClassifier(random_state=2022)
randomstate 값 주었는데
이번 강의에서는
model = LinearRegression()
값을 주지 않았네요.
전 강의에서는 baseline, 원핫 , 라벨 인코딩 등 여러번 비교하면서 평가해야해서 고정시켜준건가요?
이번 강의에서는 라벨인코딩만 사용하기로 해서 굳이 고정시킬 필요 없나요?
또한 이번 강의에서는 단순 object만 제거하는 baseline, 원핫 인코딩 라벨 인코딩 평가 점수를 비교하지 않는데
이유가 있을까요?
또한 랜덤포레스트, 선형회귀 등 여러 모델이 있는데 어떠한 경우에 각 모델을 사용해야 하는지 기준이 있을까요?
답변 1
0
LinearRegression()에는 random_state 파라미터가 없습니다. 선형회귀는 무작위성이 거의 없기 때문이기도 합니다.
네 맞습니다. 1가지 방법이 아니라 여러가지 형태를 보여주고 있어요
전처리는 자유롭게 진행하되 그 기준은 평가지표를 기준으로 가장 성능이 좋은 모델을 선택하면됩니다.
추천하는 모델은 1. 랜덤포레스트 분류/회귀 2. lightgbm 분류/회귀 입니다.