해결된 질문
작성
·
253
·
수정됨
0
안녕하세요 선생님,
첫번째 질문
작업형2 모의문제2를 수강하고 있습니다.
regressor = RandomForestRegressor()로 정의했다면,
밑에서 fit하는 것도 regressor.fit(X_tr, y_tr)로 정의하는게 맞는지 질문드리려고 합니다.
현재 노트에는 model로 정의가 되어 있습니다.
두번째 질문
수강하다가 보면 선생님께서 강의중에(아마 분류문제) 이정도 정확도?가 나왔으면 추가적으로 피처 엔지니어링이 필요 없이 그냥 제출해도 될 것 같다~ 라고 말씀을 하실 때가 있는데, 이 기준이 궁금합니다. 어느 정도여야 점수를 충분히 받는지,
예측에 있어서도 지표로 이런 판단이 가능한지 궁금합니다.
3.세 번째 질문
작업형2 모의문제 3을 듣고 있습니다.
xgboost 하이퍼파라미터 에 대해서 설명을 듣고 있는데, xgbclassifier의 max_depth의 디폴트는 3이라고 max_depth=3을 설정했을 때와 설정하지 않았을 때 값이 같음을 비교해주셨습니다.
그런데 제가 작성했을 때는 max_depth=3을 넣고, 안넣고 했을 떄 값이 다르게 나오는데, 혹시 왜 그런지 아실까요..?
(검색했을 때도 xgboost 디폴트 max_depth=3이라고 나와서 말씀해주신게 맞을 것 같은데..)
감사합니다.
답변 2
0
0
네 맞아요 model은 단순한 변수입니다 regressor로 변경라는 것이 맞아요
이 부분은 주최측에서 평가지표 기준을 제공하지 않아 전처리를 최소화한 첫 제출(베이스라인)을 기준으로 이보다 검증데이터 기준으로 점수를 좋게해서 제출하는 것으로 정리 하겠습니다😆
개인적으론 이진분류 기준 0.8 부근이면 괜찮은 모델이러 생각합니다만 성능이 너무 낮게 나오는 데이터도 있어 이 말은 무시해주세요!!
결론 본인이 만든 베이스라인보 조금 더 좋은 점수를 제출하는 것으로!!
답변 감사합니다! 세번째 질문에 대한 답을 안달아 주셔서 다시 답글 남깁니다!
감사합니다.
3.세 번째 질문
작업형2 모의문제 3을 듣고 있습니다.
xgboost 하이퍼파라미터 에 대해서 설명을 듣고 있는데, xgbclassifier의 max_depth의 디폴트는 3이라고 max_depth=3을 설정했을 때와 설정하지 않았을 때 값이 같음을 비교해주셨습니다.
그런데 제가 작성했을 때는 max_depth=3을 넣고, 안넣고 했을 떄 값이 다르게 나오는데, 혹시 왜 그런지 아실까요..?
(검색했을 때도 xgboost 디폴트 max_depth=3이라고 나와서 말씀해주신게 맞을 것 같은데..)