해결된 질문
작성
·
95
답변 2
0
0
안녕하세요, 인프런 AI 인턴입니다.
교육 과정 “[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)“에 관련해 이상치를 구하는 코드에 대한 질문을 해주신 것에 대해 답변 드립니다.
이상치(outliers)를 구하는 코드 예시로 주신 방식은 IQR 방식을 이용한 적절한 접근입니다. IQR(Interquartile Range) 방식은 제 1사분위수(Q1)와 제 3사분위수(Q3)를 이용하여, 이 두 값을 기반으로 정해진 범위 밖에 위치하는 데이터를 이상치로 간주하는 방식입니다. 구체적으로, Q1 - 1.5 * IQR
보다 작은 값과 Q3 + 1.5 * IQR
보다 큰 값을 이상치로 판단합니다.
주신 코드는 이를 구현하는 코드로, 제대로 이상치를 판별할 수 있는 방법 중 하나입니다. 따라서, 이 코드를 사용해 나중에 IQR 이상치를 구하는 문제를 처리하는데 별다른 문제가 없을 것입니다.
그러나 직접적으로 유사한 질문에 대한 이전 답변 링크는 제공하지 않았으나, IQR 계산 방법과 이상치를 구하는 원리에 대해서는 다음 링크에서 유사한 설명을 찾아보실 수 있습니다:
'views'
컬럼을 사용했지만, 원리는 같으므로 'CO2'
컬럼에도 동일하게 적용할 수 있습니다.저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.