안녕하세요! 강의 너무 잘듣고 있습니다.
회사에서 실제 데이터로 비교하다 보니 어떻게 해석해야할지 모르겠어서 문의드립니다.
정규분포에 해당되지 않는 매출 데이터 3개가 있고 (왜도로 정규분포가 아님을 확임함) 모두 대표값(평균, 중앙값)과 표준편차가 다릅니다.
1. 이 3개 집단의 IQR을 구해서 비교하는게 의미가 있는지와 대표값이 달라도 비교해서 분석이 가능하다면 아래처럼 해석해도 괜찮을까요?
<예시>
1월 표준편차 74.5, IQR 29 왜도 4.1
2월 표준편차 59.1 IQR 31 왜도 3.4
3월 표준편차 68.8 IQR 42 왜도 3.7
> 1월부터 3월로 갈수록 분포가 더 퍼지고 있다 (IQR이 더 커짐)> 1월이 가장 왼쪽으로 치우친 분포이고 2월에 조금 나아졌다가 3월에 다시 왼쪽으로 치우쳤다 (왜도가 2월에 감소했다 다시 3월에 커짐)
2. 만일 서로 다른 대표값을 가지면 IQR로 비교가 어렵다면 어떤 방법으로 비교를 할 수 있을까요?
3. 평균이 같은 두개 집단은 표준편차로 분포의 퍼짐을 보는데, 평균 다른 집단은 표준편차 끼리 비교하면 안되는거 맞을까요?