인프런 커뮤니티 질문&답변

sso03046님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전) 🆕 updated 2023.11

전처리 질문입니다.

해결된 질문

24.06.17 20:36 작성

·

100

0

뭔가 알면 알수록 계속 욕심이 생깁니다..

(시험 때 어떻게든 score를 높이기 위해..)

총구매액, 최대구매액, 환불금액 같은 경우는 숫자가 너무나도 크기 때문에, StandardScaler를 쓰면 좋을 것 같아 보입니다.

 

StandardScaler는 그 해당 컬럼 값의 max값과 min값이

1000이상 차이나면 사용하면 좋을까요?

어떤 경우에 쓰면 좋을지 방향성을 알고 싶습니다.

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 17. 21:46

모든 전처리의 의사결정은

적용 후 모델 성능을 통해 판단합니다.

 

따라서 베이스라인을 빠르게 만든 후

그리고 나서 전처리를 하나씩 변경해 결과를 비교하는 방식을 추천합니다. 💪

sso03046님의 프로필 이미지
sso03046
질문자

2024. 06. 18. 09:32

드라마틱한 차이는 없지만, 이런식으로 오르면 채택하고, 성능이 떨어지면 채택하지 않는 식으로 하면 된다는 거죠?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 18. 10:27

네 맞습니다

랜포나 라이트지비엠이 트리계열이라 스케일링 효과가 크지 않아요 미미한 수준

sso03046님의 프로필 이미지

작성한 질문수

질문하기