작성
·
454
0
안녕하세요 실루엣 계수 및 실루엣 스코어 관련 강의를 들으면서 아래와 같이 궁금한점이 생겨서 질문드립니다!
실루엣 계수가 -1~1이고 ,이들의 평균인 실루엣 스코어가 0~1이라고 하셨는데, 범위가 -1~1인 숫자들끼리 평균을 내면 사실 이에대한 결과값인 실루엣스코어의 범위도 똑같이 -1~1이 되어야 할 것 같은데, 범위가 0~1인 이유가 궁금합니다!
좋은 군집을 판단하는 기준을 말씀하실 때 실루엣 스코어와 각 군집별 실루엣계수 평균값들의 편차를 동시에 고려해야 한다고 하셨습니다.
다만 위와같은 판단 기준이 다소 애매모호해 보이는데 실무에서는 정확히 어떤 기준으로 위와같은 두 가지 판단기준을 '동시에&복합적으로' 고려하는지 예시가 궁금합니다.
ex) 각 군집화 케이스별로 군집별 실루엣 계수의 평균값에대한 표준편차를 산출하고 이를 비교하고, 동시에 각 군집화 케이스별로 실루엣스코어를 산출하여 이 두 가지 값 중 어떤것에 우선순위를 두고 평가하는지 등
답변 1
0
안녕하십니까,
실루엣 계수가 -1과 같이 마이너스 값이 되는 경우는 잘못된 클러스터에 데이터가 할당되는 경우인데, 이런 경우는 거의 발생하지 않습니다. 그러니까 실루엣 계수가 마이너스 값을 가지는 경우는 거의 없습니다. 물론 발생할 수도 있기에 가능 범위가 -1 ~ 1 사이가 될수는 있지만 현실적으로는 어렵기에 보통 0~1 사이로 실루엣 스코어가 발생한다라는 차원에서 이해해 주셨으면 합니다.
이건 뒷 강의에서 실습을 하면서 보다 자세하게 말씀드립니다. 이후 강의 2개를 들으시고도 여전히 이해가 부족하시다면 다시 질문 부탁드립니다.
감사합니다.