로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

인공지능 및 기계학습 개론 II

임시 이미지 KAIST 산업및시스템공학과 문일철 교수 KOOC (KAIST Open Online Course)
http://www.edwith.org/machinelearning2__17/forum/40197
좋아요 1110 수강생 5461

Gaussian Mixture Model은 대표적인 Probabilistic Clustering Algorithm입니다.

그런데, Gaussian Mixture Model의 경우, data가 Euclidean space에 분포해 있을 때 사용이 가능한 모델인데, 특수한 경우, data는 bounded space에 분포해 있기도 하고, 심지어는 discrete space에 분포해 있기도 합니다.

data가 bounded space에서 정의되어 있는데 clustering을 해야 할 경우 방법은 두가지가 있습니다.

첫번째, bounded space에 분포해 있는 data를 Euclidean space로 transform해준 후에 GMM을 사용할 수 있겠습니다.

두번째, bounded space에 분포해 있는 raw data를 그대로 사용해 Beta Mixture Model을 사용하는 것입니다.

Beta Mixture Model (BMM)의 parameter 또한 GMM에서와 마찬가지로 EM algorithm을 사용할 수 있는데, GMM에서의 EM과는 달리, BMM은 maximization step에서 closed-form solution이 없기 때문에 gradient descent 방법 등을 이용하여 maximize를 수행합니다.


BMM에 대해 알 수 있는 문헌으로 https://almob.biomedcentral.com/articles/10.1186/s13015-017-0112-1 가 있습니다.


감사합니다