해결된 질문
작성
·
235
0
수치형 변수는 minmaxscaler, 범주형 변수는 라벨인코딩을 사용했고
모델은 randomforestregressor를 사용하였습니다.
max_depth나 n_estimator는 바꿔봐도 기본값과 큰차이 없거나 MAE값이 더 올라가서
random_state값만 지정해주고 따로 튜닝은 하지 않았습니다.
다른분들 후기를 보니 범주형 변수중에 name컬럼은 유니크값이 2개여서
name컬럼은 원핫인코딩, 나머지는 라벨인코딩 하신분들이 계시더라구요.
저는 MAE값이 116정도로 나왔고 이대로 제출했는데 다른분들은
100대로 나오신분들이 많이 계신거 같아서 혹시 감점요소가 있을지 궁금합니다.
답변 1
0
유니크 값이 2개인 경우 라벨과 원핫 차이는 거의 없습니다.
116과 100은 검증데이터 나누는 기준에서 차이가 생길 수 있는 부분이라 말씀하신 다른 분들과 큰 차이는 없어보여요!
명시된 csv에서 감점 외 mae의 감점은 공개를 하고 있지 않아 정확하게 파악은 어렵습니다만
크게 감점될 요인은 보이지 않아보여요!!
고생 많으셨습니다.
감사합니다!