- LSA latent semantic analysis
映射词-文档到一个低维隐语义空间
比较词和文档在低纬空间的相似性
- topic 是 Vocab 上的概率分布(符合多项式分布)
- 文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型
- plsa 模型
- LDA模型
- 大规模LDA系统
- spark LDA
- Google PLDA
- 微软LightLDA
- 腾讯LDA,PEACOCK
LDA(文档主题模型)
原文:http://www.cnblogs.com/ChenAlong/p/5228329.html