인프런 커뮤니티 질문&답변

SeungHoon Paik님의 프로필 이미지
SeungHoon Paik

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

선형회귀모델을 위한 데이터변환

작성

·

160

0

타깃값의 경우 일반적으로 로그변환을 적용한다고 설명해주셨는데

positive skew, negative skew 인 두가지 모두의 경우 즉 분포의 왼쪽,오른쪽 쏠림 모든경우에 log변환을 하면되는건가요?

두경우다 쏠린값을 log값이 해결해주는것인지 궁금합니다. 

+ feature값도 동일한 원리인지 궁금합니다

강의와 관련있는 질문을 남겨주세요.
• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)
• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)
서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등)

질문 전달에도 요령이 필요합니다.
• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.
• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.
• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. 
• 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요!

구체적인 질문일수록 명확한 답을 받을 수 있어요.
• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.
• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.
• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다.

기본적인 예의를 지켜주세요.
• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. 
• 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. 
반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다. 

답변 3

0

권 철민님의 프로필 이미지
권 철민
지식공유자

scipy의 skew()함수의 반환값은  0 이상 값(0포함)이며 right skew(즉 오른쪽 꼬리 늘어짐)에 대해서만 계산을 해줍니다.

일반적으로 0보다 크면 오른쪽 tail 이 skew 된 형태를 의미합니다. 1로 skew정도가 상당히 높은 수준입니다.

0

그렇다면 skew함수를 통해 그 값이 1이상인 feature들을 log변환 하셨는데

1이상인 값을 갖는 feature의 분포가 right skew인 건가요??? 

음수의 값을 가지면 left skew인건지 궁금합니다

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

log transformation은 right skew인 경우에만 적용합니다.(feature도 동일합니다)

아무래도 큰 값들을 Log 형태로(보다 작게) 변환하면서 right skew 현상을 보완하기 때문입니다.

left skew는 일반적으로는 크게 머신러닝에 영향을 미치지는 않는 것 같습니다. x를 x제곱으로 변환하는 기법이 left skew보완 기법으로 이론적으로 있으나 잘 사용하지 않습니다.

감사합니다.

SeungHoon Paik님의 프로필 이미지
SeungHoon Paik

작성한 질문수

질문하기