21.05.15 18:55 작성
·
147
0
안녕하세요. 요즘 강의 정말 잘 듣고 있습니다.
Feature Selection할 때, '피처를 하나씩 추가하고 변경해 가면서 성능이 좋지 않은 피처는 제거하도록 한다.'라고 하셨는데, 그래서 그런지 밑에 선생님이 적으신거 보니
feature_names = ["season", "weather", "temp", "atemp", "humidity", "windspeed",
"year", "hour", "dayofweek", "holiday", "workingday"]
기존 feature 중에서 "month"를 빼셨더라구요.
그래서 "month"는 빼는게 성능이 더 좋아지나보다 했는데, 제가 "month" 한번 넣어봤더니 더 좋아지더라구요.
그래서 결론은 깜빡하시고 뺀건지, 아니면 그냥 제 경우에서만 이렇게 나온건지 궁금합니다.
그리고 추가적으로 피처를 변경해 가면서 성능을 확인하면 계속 30초씩 걸리는데, 원래 이런식으로 계속 돌려가면서 확인을 해야되는건가요? 그냥 몰라서 여쭤봅니다.
랜덤포레스트는 자체적으로 피처를 줄이니까 그냥 다 넣으면 안될까 해서요.
감사합니다.
답변