해결된 질문
작성
·
196
0
GMM은 정규분포를 가정하고 데이터셋을 군집화 한다고 설명하셨습니다. 그러면 정규분포함수의 밀도가 가장높은 지점이 각군집의 센터라고 생각할 수 없나요? 혹시 이 센터를 쉽게 구할수 있는 함수는 없나요?
답변 2
0
0
안녕하십니까,
군집 중심점이라는 것이 군집화 내에 여러 데이터 포인트들이 거리 중심점이라는 개념이 강해서 사이킷런의 GMM에서는 군집 중심점을 구할수 있는 함수가 없습니다. 하지만 말씀하신대로 GMM의 군집 중심점(센터)을 정규분포함수의 밀도가 가장높은 지점으로 간주 할 수도 있습니다.
아쉽게도 이걸 어떻게 구해야 할지 사이킷런의 GaussianMixture 객체에서 찾지를 못했습니다. GaussianMixture 객체의 means_와 covariance_를 잘 조합해서 밀도를 추정한 뒤 가장 높은 밀도를 가지는 중심점을 찾을 수도 있을 것 같습니다만, 정확한 방법은 현재는 잘 모르겠습니다.
좋은 질문 감사합니다.