작성한 질문수
실전 데이터 사이언스 Part2. 데이터 전처리
이상치 제거
작성
·
381
0
안녕하세요.
6 시그마 이상인 값들은 이상치에 해당되는 샘플이라고 하셨는데 그 이유를 알 수있을까요? 수학적이라던지 아니면 통계학적으로라던지 근거를 알 수 있을까요?
답변 1
6 시그마는 예를 든 것입니다. 매우 드물게 발생할 확률을 말할때 상징적으로 6 시그마를 (표준편차)를 말합니다.
경우에 따라서 3이나 4를 선택할 수도 있습니다. 이상치의 정도는 상황에 따라 정하기 나름입니다~