6)常用特征提取方法
1、潜在语义索引:利用SVD奇异值分解方法来获得文本的主题
2、主成分分析(PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
3、线性判别分析
在自然语言处理领域, LDA是隐含狄利克雷分布,他是一种处理文档的主题模型。LDA是一种监督学习的降维技术,而PCA是无监督的降维技术,LDA是在降维的基础上考虑了类别的因素,希望得到的投影类内方差最小,类与类之间的方差最大。
(7)为什么要卷积?
第一种称为参数共享。理想的是,在图像的一个部分中有用的特征检测器可能在图像的另一部分中有用。例如,边缘检测器可能对图像的许多部分有用。参数的共享允许参数的数量很小并且还允许稳健的平移不变性。翻译不变性是指猫移动和旋转的概念仍然是猫的图片。
第二个被称为稀疏连接。每个输出层只是少量输入的函数(特别是滤波器大小的平方)。这大大减少了网络中的参数数量,并允许更快的培训。
原文:https://www.cnblogs.com/ubkz/p/15196080.html