首页 > 其他 > 详细

topic model

时间:2014-08-09 02:24:56      阅读:432      评论:0      收藏:0      [点我收藏+]

0、基石——贝叶斯推断

计算后验概率即为我们对参数的估计:

bubuko.com,布布扣

其中:

? ??bubuko.com,布布扣——输入数据

? ??bubuko.com,布布扣?——待估计的参数

? ??bubuko.com,布布扣——似然分布

? ??bubuko.com,布布扣?——参数的先验分布

?

对新样本的预测:我们要估计bubuko.com,布布扣的概率

bubuko.com,布布扣

1、常用的概率分布

Dirichlet Distribution

bubuko.com,布布扣

2、文本建模

2.1 基本模型——unigram model

最基本的一种文本模型。

我们做这样的假设:语料库是从词表bubuko.com,布布扣中独立的抽取的bubuko.com,布布扣个。有似然方程

bubuko.com,布布扣其中bubuko.com,布布扣是term[t]出现的次数。我们的目标是估计bubuko.com,布布扣,根据贝叶斯推断的方法,我们需要引入bubuko.com,布布扣的一个先验分布。

bubuko.com,布布扣计算后验概率

bubuko.com,布布扣?

?

?

?

?

?

topic model,布布扣,bubuko.com

topic model

原文:http://www.cnblogs.com/zjgtan/p/3900362.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!