首页 > 其他 > 详细

[模式识别].(希腊)西奥多里蒂斯<第四版>笔记5之__特征选取

时间:2014-07-20 10:14:09      阅读:363      评论:0      收藏:0      [点我收藏+]

1,引言

有关模式识别的一个主要问题是维数灾难。我们将在第7章看到维数很容易变得很大。

    降低维数的必要性有几方面的原因。计算复杂度是一个方面。另一个有关分类器的泛化性能。

    因此,本章的主要任务是:在尽可能保留特征的分类判别信息前提下,来选择重要的和维数少的特征量。这个过程被称作特征选择或者特征降维。

    定量描述来讲,选择的特征应该使得类内距离减小,类间距离增大。

    一些文献表述中使用feature extraction,而不是我们本文使用的featureselection。这将会和第7章的一些描述有些冲突。

    2,预处理

① 离群值删除(outlier removal)

离群值定义为偏离相关变量均值较大的点

② 数据归一化

许多特征值位于不同的动态阈中,而大的特征值对损耗函数会有较大影响。所以归一化到相似阈值会有帮助。

③ 缺失数据

一些特征会从特征量量中缺失。例如遥感在特定区域被其他传感器覆盖的情况就是如此。

3,峰值现象

4,基于统计假设的特征选取

5,接收操作(THE RECEIVER OPERATING)特性曲线

6,类可分性度量

7,特征子集选取

8,最优特征代(OPTIMAL FEATURE GENERATION)

9,神经网络和特征选取

10,一个提示泛化理论

11,贝叶斯信息标准

[模式识别].(希腊)西奥多里蒂斯<第四版>笔记5之__特征选取

原文:http://blog.csdn.net/glb562000520/article/details/37989017

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!