针对给出的样本构建一个模型,在模型范围内的样本点被认为是正常的,超出阈值的样本点被认为是异常的。
异常检测
针对少量正样本(y=1),用大量负样本(正常)学习p(x)值
监督学习
大量正样本(异常样本)可以用来更新参数
有大量的正样本和负样本也用监督学习
\[ p(X;\mu,\Sigma)=\frac{1}{(2\pi)^{n/2}|\Sigma|^{1/2}}exp(-\frac{1}{2}(X-\mu)^T\Sigma^{-1}(X-\mu))\tag{14.1} \]
改变协方差矩阵和均值可以捕捉不同的分布
样本数量m需要大于特征数量n,一般\(m\ge10n\)使用
通过已有的评价去推测未知的评价
因为假设已经有电影评价特征量\(x\),学习得到用户特征量\(\theta\)
相当于多个参数向量的线性回归,去掉了样本总量m
估计用户的特征值\(\theta\)
假设有部分用户特征量\(\theta\),学习得到未知的电影评价特征量\(x\),再反推用户特征量\(\theta\) ,不断往复
估计电影的特征值\(x\)
可计算用户j对电影i的评分预测
原文:https://www.cnblogs.com/jestland/p/11548536.html