인프런 커뮤니티 질문&답변

nam1520님의 프로필 이미지
nam1520

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 관련 질문 있습니다.

해결된 질문

작성

·

84

·

수정됨

0

안녕하세요 강의 잘 듣고 있습니다!

작업형2 관련 질문 세개 있습니다.

Q1) 랜덤포레스트 하이퍼파라미터 조절 max_depth나 n_estimator

(아래처럼 ) 분류가 아닌 회귀분석일때도 사용해도 되나요??

Q2) 데이터개수가 너무 많으면 원핫인코딩보다 라벨인코더가 낫다고 하셨는데 개수가 많은 기준이 보통 어느 정도인지 궁금합니다!

 

Q3) 검증데이터 분리 시에 test_size는 어느 정도가 적당한지 궁금합니다. 데이터가 적으면 0.1 ~ 0.15 아니면 0.2 정도로 해도 될까요?

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. 네 사용가능해요.
    조금 불안해서 그런데 하이퍼파라미터 사용 전과 후 비교가 가능할까요?
    만약 비교가 어렵거나 아직 베이스라인이 완벽하지 않다면 사용하지 않는 것을 추천합니다. 잘못 사용하면 오히려 성능이 떨어집니다. 힘들게 사용하진 마셔요! 지금까지는 튜닝없이 40점이 가능한 수준이었어요!
    (데이터에 따라 다르지만 경험상 회귀는 max_depth가 3보다는 더 커야 했거든요~ 7~12정도?, n_estimators를 1000까지 올리는건 시간이 오래걸릴 수도 있어요 500언더를 추천합니다. )

     

     

  2. 정해진건 없습니다면 10개를 기준으로 하시죠!!

  3. 이것도 데이터에 따라 다르지만 0.2로 하시죠!!

     

     

     

nam1520님의 프로필 이미지
nam1520
질문자

자세한 답변 감사합니다 :)

하이퍼파라미터 사용 전 후 비교한 코드입니다.

image

nam1520님의 프로필 이미지
nam1520

작성한 질문수

질문하기