1、我们有什么?
我们有训练集:{x(i), y(i)}
2、我们想要做什么?
对于一个新的样本x输入进来,我们能够把y预测的准。
3、问题有哪些?
输出空间y:
连续:回归问题
离散:分类问题
训练集:
有监督:
无监督:
半监督:
4、怎么做?
构建目标函数:训练集合的后验概率最大P(Y|X)
优化:梯度下降
5、生成模型做分类?
训练:每个类各自认为服从一个什么分布(高斯、泊松、beta),然后计算P(X|Y=k)的参数。
预测:对于输入样本x,计算各个类的p(y|x)=p(x|y)p(y)/p(x),选择概率最大的y
与判别模型的区别:直接计算p(y|x),生成模型时Baysian
原文:http://www.cnblogs.com/zjgtan/p/3556818.html