首页 > 其他 > 详细

《机器学习实战》第3章 决策树 学习笔记

时间:2016-06-10 19:03:39      阅读:219      评论:0      收藏:0      [点我收藏+]

     决策树从数据集合中提取出一系列的规则,这些规则可以用流程图表示,其数据形式非常容易理解;专家系统中就经常使用决策树。

1、决策树的构造:①采用ID3算法(最高信息增益)划分数据集;②递归创建决策树。

2、使用matplotlib的注解功能,可以将存储的树结构转化为容易理解的图形。

3、使用python的pickle模块可用于存储决策树的结构。

4、对于过度匹配的问题,可以通过裁剪树的手段来消除。

5、ID3算法适合处理标称型数据,如果是数值型数据,必须离散化。

6、还有其他的决策树算法,最流行的树C4.5和CART。无论是ID3还是C4.5最好在小数据集上使用,决策树分类一般只试用于小数据。当属性取值很多时最好选择C4.5算法,ID3得出的效果会非常差。

《机器学习实战》第3章 决策树 学习笔记

原文:http://www.cnblogs.com/lutaitou/p/5574037.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!