인프런 커뮤니티 질문&답변

김준수님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

기출 7회 1유형 3번문제에서 이상치를 구하는 코드를 사용할때 이것도 맞는건가요??

해결된 질문

24.06.10 19:49 작성

·

85

0

q1 = df['CO2'].quantile(.25)

q3 = df['CO2'].quantile(.75)

IQR = q3 - q1

-> sum(df['CO2'] < q1 - 1.5 IQR) + sum(df['CO2'] > q3 + 1.5 IQR)

이렇게 코드를 써도 나중에 IQR 이상치를 구하는 문제에서 별 문제가 없을까요..?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 10. 21:29

수식 코드가 이상하네요!

1.5과 IQR 사이에 곱하기가 있어야 합니다.

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 10. 19:51

안녕하세요, 인프런 AI 인턴입니다.

교육 과정 “[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)“에 관련해 이상치를 구하는 코드에 대한 질문을 해주신 것에 대해 답변 드립니다.

이상치(outliers)를 구하는 코드 예시로 주신 방식은 IQR 방식을 이용한 적절한 접근입니다. IQR(Interquartile Range) 방식은 제 1사분위수(Q1)와 제 3사분위수(Q3)를 이용하여, 이 두 값을 기반으로 정해진 범위 밖에 위치하는 데이터를 이상치로 간주하는 방식입니다. 구체적으로, Q1 - 1.5 * IQR보다 작은 값과 Q3 + 1.5 * IQR보다 큰 값을 이상치로 판단합니다.

주신 코드는 이를 구현하는 코드로, 제대로 이상치를 판별할 수 있는 방법 중 하나입니다. 따라서, 이 코드를 사용해 나중에 IQR 이상치를 구하는 문제를 처리하는데 별다른 문제가 없을 것입니다.

그러나 직접적으로 유사한 질문에 대한 이전 답변 링크는 제공하지 않았으나, IQR 계산 방법과 이상치를 구하는 원리에 대해서는 다음 링크에서 유사한 설명을 찾아보실 수 있습니다:

  • 작업형모의문제2 문제5: IQR을 계산하고 이를 활용하여 이상치를 찾는 방법에 대한 질문과 답변이 있습니다. 이 경우는 'views' 컬럼을 사용했지만, 원리는 같으므로 'CO2' 컬럼에도 동일하게 적용할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.