인프런 커뮤니티 질문&답변

JeHeon Park님의 프로필 이미지
JeHeon Park

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런을 이용한 GMM 군집화 실습

GMM관련해서 질문드립니다.

해결된 질문

작성

·

196

0

GMM은 정규분포를 가정하고 데이터셋을 군집화 한다고 설명하셨습니다. 그러면 정규분포함수의 밀도가 가장높은 지점이 각군집의 센터라고 생각할 수 없나요? 혹시 이 센터를 쉽게 구할수 있는 함수는 없나요?

답변 2

0

JeHeon Park님의 프로필 이미지
JeHeon Park
질문자

항상 좋은 답변 감사합니다.

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

군집 중심점이라는 것이 군집화 내에 여러 데이터 포인트들이 거리 중심점이라는 개념이 강해서 사이킷런의 GMM에서는 군집 중심점을 구할수 있는 함수가 없습니다. 하지만 말씀하신대로 GMM의 군집 중심점(센터)을  정규분포함수의 밀도가 가장높은 지점으로 간주 할 수도 있습니다.

아쉽게도 이걸 어떻게 구해야 할지 사이킷런의 GaussianMixture 객체에서 찾지를 못했습니다.  GaussianMixture 객체의 means_와 covariance_를 잘 조합해서 밀도를 추정한 뒤 가장 높은 밀도를 가지는 중심점을 찾을 수도 있을 것 같습니다만, 정확한 방법은 현재는 잘 모르겠습니다.

좋은 질문 감사합니다.

JeHeon Park님의 프로필 이미지
JeHeon Park

작성한 질문수

질문하기