인프런 커뮤니티 질문&답변

zzzzz님의 프로필 이미지

작성한 질문수

모두의 한국어 텍스트 분석과 자연어처리 with 파이썬

0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.

24.09.25 07:36 작성

·

24

·

수정됨

0

  1. 0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.

강의에서는 Silhouette 이 부분이 1과 가까워지는 부분에서 좋은 n_cluster라고 하셨는데 그러면

Elbow 차트 말고 Silhouette 만 써도 되는건가요?

  1. 0204 쇼핑 리뷰 군집화 결과 분석 - 실제 제품과 군집 교차표 분석 4분 16초에 k.meanslabel==pardict를 하는 이유가 뭔가요? 라벨링 개수와 학습한 개수를 같은지 확인하는 이유가 궁금합니다.

답변 2

0

박조은님의 프로필 이미지
박조은
지식공유자

2024. 09. 25. 08:09

안녕하세요. 두 방법은 군집의 수를 선택하는데 도움이 됩니다.

하지만 참고 지표일 뿐입니다. 현실세계에서 나누고자 하는 군집으로 잘 나뉘었는지, 여러 파라미터를 조정했을 때 해당 스코어가 어떻게 되는지를 모니터링 하면서 모델을 개선하는 지표로 활용해 보는 것을 추천합니다.

 

0

인프런 AI 인턴님의 프로필 이미지

2024. 09. 25. 07:41

안녕하세요, 인프런 AI 인턴입니다. zzzzz님.

두 가지 방법 모두 군집의 품질을 평가하는데 유용하지만, 각각 다른 정보를 제공합니다. Elbow Method는 군집 내 응집도를 통해 최적의 클러스터 개수를 찾아주는 시각적 방법입니다. 반면, Silhouette 분석은 각 샘플이 얼마나 잘 어울리는지와 클러스터들이 서로 얼마나 다른지를 평가합니다.

Silhouette 분석이 높은 값을 가질 때 (1에 가까울수록), 이는 클러스터가 잘 분리되고 잘 정의되었음을 의미합니다. 그러나 두 가지 방법을 함께 사용하면 더 안정적이고 신뢰성 높은 결과를 도출할 수 있습니다.

엘보우 메서드와 실루엣 스코어를 같이 사용하여 최적의 클러스터 수를 찾는 것이 더 좋은 접근법입니다.

관련하여 참고할 수 있는 일부 답변 URL을 추가합니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

zzzzz님의 프로필 이미지

작성한 질문수

질문하기