작성
·
167
0
안년하세요 강사님, 6장에서 신용카드 문제에 대해서 질문이 있습니다.
책에서는 전체 피처를 6개로 줄입니다. 저는 상관관계가 높은 피처만을 차원축소하고 나머지 피처는 그대로 사용해보려고 했는데 정확도가 많이 낮아졌습니다. 기존에 상관관계가 높았던 BILL_AMT1~6까지를 축소하고 이를 원데이터에서 BILL_AMT1~6 컬럼을 드랍한 데이터프레임과 합쳐서 학습 및 평가를 수행했는데 이 과정에서 예측성능이 안좋아진 이유가 있을까요?
답변 3
1
해당 경우에 cv=3 으로 설정하면 성능이 잘 안나오는 군요. cv=5로 적용하니 원본 데이터 정도로 성능이 나옵니다. cv=3으로 할때 뭔가 학습/검증 중 어느 한세트가 성능이 완전히 잘못 나온것 같습니다.
0
이런 식으로 코드를 짜봤는데 0.61정도로 예측 성능이 많이 떨어지는 것 같습니다
0
아하 그렇군요 교차검증 세트를 늘리니 성능이 확 올라가는 듯 합니다!
매번 감사합니다:)