작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2(신 버전)
해결된 질문
작성
·
114
0
뭔가 알면 알수록 계속 욕심이 생깁니다..
(시험 때 어떻게든 score를 높이기 위해..)
총구매액, 최대구매액, 환불금액 같은 경우는 숫자가 너무나도 크기 때문에, StandardScaler를 쓰면 좋을 것 같아 보입니다.
StandardScaler는 그 해당 컬럼 값의 max값과 min값이
1000이상 차이나면 사용하면 좋을까요?
어떤 경우에 쓰면 좋을지 방향성을 알고 싶습니다.
답변 1
모든 전처리의 의사결정은
적용 후 모델 성능을 통해 판단합니다.
따라서 베이스라인을 빠르게 만든 후
그리고 나서 전처리를 하나씩 변경해 결과를 비교하는 방식을 추천합니다. 💪
드라마틱한 차이는 없지만, 이런식으로 오르면 채택하고, 성능이 떨어지면 채택하지 않는 식으로 하면 된다는 거죠?
네 맞습니다
랜포나 라이트지비엠이 트리계열이라 스케일링 효과가 크지 않아요 미미한 수준
드라마틱한 차이는 없지만, 이런식으로 오르면 채택하고, 성능이 떨어지면 채택하지 않는 식으로 하면 된다는 거죠?