작성
·
160
0
타깃값의 경우 일반적으로 로그변환을 적용한다고 설명해주셨는데
positive skew, negative skew 인 두가지 모두의 경우 즉 분포의 왼쪽,오른쪽 쏠림 모든경우에 log변환을 하면되는건가요?
두경우다 쏠린값을 log값이 해결해주는것인지 궁금합니다.
+ feature값도 동일한 원리인지 궁금합니다
강의와 관련있는 질문을 남겨주세요.
• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)
• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)
• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등)
질문 전달에도 요령이 필요합니다.
• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.
• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.
• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요.
• 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요!
구체적인 질문일수록 명확한 답을 받을 수 있어요.
• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.
• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.
• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다.
기본적인 예의를 지켜주세요.
• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다.
• 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요.
• 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
답변 3
0
scipy의 skew()함수의 반환값은 0 이상 값(0포함)이며 right skew(즉 오른쪽 꼬리 늘어짐)에 대해서만 계산을 해줍니다.
일반적으로 0보다 크면 오른쪽 tail 이 skew 된 형태를 의미합니다. 1로 skew정도가 상당히 높은 수준입니다.
0
그렇다면 skew함수를 통해 그 값이 1이상인 feature들을 log변환 하셨는데
1이상인 값을 갖는 feature의 분포가 right skew인 건가요???
음수의 값을 가지면 left skew인건지 궁금합니다
0
안녕하십니까,
log transformation은 right skew인 경우에만 적용합니다.(feature도 동일합니다)
아무래도 큰 값들을 Log 형태로(보다 작게) 변환하면서 right skew 현상을 보완하기 때문입니다.
left skew는 일반적으로는 크게 머신러닝에 영향을 미치지는 않는 것 같습니다. x를 x제곱으로 변환하는 기법이 left skew보완 기법으로 이론적으로 있으나 잘 사용하지 않습니다.
감사합니다.