首页 > 编程语言 > 详细

降维算法的变量选择

时间:2019-08-15 15:51:39      阅读:76      评论:0      收藏:0      [点我收藏+]

在针对变量多、纬度高的多变量训练模型时可过滤的变量

1.缺失的变量值

2.低方差

3.高线性度:可利用Pearson (continuous variables) or Polychoric (discrete variables) 相关矩阵进行判断

4反向特征消除:

在消除每个变量(n次)后,计算误差平方和(SSR)。

然后,识别那些删除后SSR增加最小的变量,最后删除它,使我们有n-1输入特性。

重复此过程,直到不能删除其他变量

5.因子分析法

因子分析都是以普通因子分析模型作为理论基础,其主要目的都是浓缩数据,

通过对诸多变量的相关性研究,可以用假想的少数几个变量(因子、潜变量)来表示原来变量(观测变量)的主要信息。

 

转:https://www.analyticsvidhya.com/blog/2015/07/dimension-reduction-methods/

降维算法的变量选择

原文:https://www.cnblogs.com/jzzyg/p/11358241.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!