首页 > 其他 > 详细

PCA 原理

时间:2020-04-23 17:18:47      阅读:75      评论:0      收藏:0      [点我收藏+]

一、PCA原理:

•主成分分析(Principal Components Analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。PCA的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。

算法流程:

输入:n为样本集技术分享图片 ,设为 X, 需要降维到  技术分享图片

输出: 降维后的样本集 技术分享图片

(1)先对所有的数据集进行中心化:技术分享图片

(2)计算样本的协方差矩阵 : 技术分享图片

(3)对协方差矩阵进行求特征值和特征向量

(4)取出技术分享图片 个最大的特征值对应的特征向量技术分享图片, 将所有的特征向量标准化,组成新的矩阵 w

(5)输出矩阵:Y= WX  即为降 维到  技术分享图片 维后的数据

基于最大投影方差:

       假设m个n维数据技术分享图片 都已经对其进行中心化处理了, 技术分享图片, 经过投影变换后得到的新坐标系为技术分享图片,其中w 是标准正交基,即技术分享图片

        如果我们将数据从n维降到n‘维,即丢弃新坐标系中的部分坐标,则新的坐标系为技术分享图片,样本点x(i)在n‘维坐标系中的投影为:技术分享图片.其中,技术分享图片是x(i)在低维坐标系里第j维的坐标。

对于任意一个样本x(i),在新的坐标系中的投影为技术分享图片  ,在新坐标系中的投影方差为技术分享图片,要使所有的样本的投影方差和最大,也就是最大化技术分享图片,即:

                                                                       技术分享图片

技术分享图片技术分享图片?

 u1方向上的投影的绝对值之和最大(也可以说方差最大),就是将x与u1做内积。将u1标准化为单位向量。

使用拉格朗日函数可以得到:

技术分享图片

对W求导有技术分享图片, 整理下即为:

                                                      技术分享图片

对W 的求导可以把 技术分享图片, 然后再使用下面的公式进行求导,两边都有个2 ,可以约去。

对于矩阵的求导可以参考:https://blog.csdn.net/xueyingxue001/article/details/51829718

技术分享图片技术分享图片?

技术分享图片技术分享图片?

几个常用的向量求导公式:

技术分享图片技术分享图片?

 如果 y = xT·A·x的话,y对向量x求偏导的结果是

技术分享图片技术分享图片?

如果这时A有时对称阵,则:

技术分享图片技术分享图片?

由于协方差矩阵是对称的,因此其特征向量正交。最后一步的矩阵乘法就是将原始样本点分别往特征向量对应的轴上做投影。

如果数据集是100 X 10,100行10列的,需要保留4个特征量,即选出4个最大的特征值,使原数据(100 X 10)* (10 X 4)=(100 X 4 ),10乘4 代表4个重要的特征向量聚合。

 


技术分享图片?

技术分享图片

参考:https://blog.csdn.net/zhongkelee/article/details/44064401此文章讲的比较详细

           http://www.cnblogs.com/pinard/p/6239403.html

 

 

 

PCA 原理

原文:https://www.cnblogs.com/junge-mike/p/12761787.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!