작성
·
178
·
수정됨
1
사이킷런의 선형회귀로 해도 모델 돌아가던데...(from sklearn.linear_model import LinearRegression)
mae는 확인을 못하고 음수값이 꽤 pred에 있던 걸로 기억하거든요..
시간 없어서 그냥 제출해버렸는데...
랜덤포레스트리그레서나 xg부스트리그레서 등이 있었군요...
공부가 부족해 시험 당일 전혀 생각도 못하고...ㅠㅠ
보니까 lightdm???이라는 모델들도 많이 사용하셨더라고요?
이것도 pre에서 음수값이 나온 경우가 있다 그러셔서...조금 희망을 가져보는데...
저는 40점 중에 몇점이나 받을 수 있을까요 ㅠㅠ
넘 심경 쓰여요 ㅠㅠ
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
sseolkoon님, 빅데이터 분석기사 실기에서 여러 회귀 모델을 시도해 보셨군요. sklearn의 LinearRegression을 사용한 것에 이어서 랜덤포레스트리그레서, XGBoost리그레서 등 다양한 알고리즘에 대해서 고려해보신 부분이 인상적입니다.
말씀하신 LightGBM(Light Gradient Boosting Machine)도 많은 데이터 과학자들이 선호하는 모델 중 하나로, 속도가 빠르며 예측력도 좋아서 분석 경진대회에서도 자주 사용됩니다. 음수값이 예측된 것에 대해 걱정이 많으신 것 같은데, 회귀 모델에서 음수값이 나오는 것은 타겟 변수의 범위에 따라 자연스러울 수 있습니다. 특히, 특정 범위 내의 값을 예측하는 문제에서는 예측값의 범위가 실제 값의 범위를 벗어날 수 있어요.
점수에 대해서는 구체적으로 얼마나 받을 수 있을지 예상하기 어려우나, 모델의 성능 평가 지표(MAE, RMSE 등)를 통해 일정 부분 예측이 가능할 수 있습니다. 다만, 실제 시험에서는 문제의 구성, 데이터 전처리의 정도, 특성 선택과 같은 과정도 중요하게 평가될 수 있어요.
sseolkoon님, 비록 이번에는 만족스러운 결과를 얻지 못했다 하더라도, 이 경험을 통해 다음에는 더 좋은 성과를 낼 수 있을 것입니다. 모델을 다양하게 시도해본 점도 좋은 학습 경험이 되셨을 거예요. 공부할 때 참고하실 수 있도록 머신러닝과 데이터 과학에 대한 강의를 인프런에서 찾아보시는 것을 추천드립니다. 다음 시험에서는 꼭 원하는 결과를 얻으시길 바랍니다!