EMアルゴリズムの良問2選

EMアルゴリズム自体の説明は溢れてるけど実際にEMアルゴリズムを使って何かを解いてみたっていう例題はGMM(Gaussian Mixture Model)以外あまり見ないので、PLSA(Probabilistic Latent Semantic Analysis)とSSNB(Semi-Supervised Naive Bayes)をEMアルゴリズムであまり省略なく丁寧に解いてみる。

  • 論文
    • "Unsupervised learning by probabilistic Latent Semantic Analysis", JMLR, 2001
    • "Text Classification from Labeled and Unlabeled Documents using EM", JMLR, 2000

対象読者

以下の三つに当てはまる人を想定しています。

  • EMアルゴリズムについてなんとなく知ってるけど実際に使ったことはあまりない
  • PLSAについてなんとなく知ってるけど自分でちゃんと導出したことはない
  • ナイーブベイズについて知っているけど半教師ありナイーブベイズについては知らない、あるいは自分でちゃんと導出したことはない