首先,为什么机器学习很重要?我们一般的程序只能解决输入一定、计算过程一定、输出一定的问题。但是在现实生活中我们有很多问题都是无法用语言进行准确描述,我们在这里以一个反垃圾软件系统为例。如果我们需要建立一个反垃圾邮件系统,传统的手段没有办法很好的解决。对于这个问题,我们可以如下分析:1)通过人工手段判断可以简单分辨的邮件,并对这些邮件进行分类。2)对垃圾邮件的内容进行分析,归纳总结出一些特征。3)将这些特征写成代码,并且编写一个程序。4)通过这个程序对新的一批邮件进行判断,并且通过人工监督它的判断是否正确,然后不断调整特征。这样我们就能够很好的解决这个问题了,上面的过程就是机器学习要干的事情。
目前,机器学习主要解决10种典型问题:
1)垃圾邮件检测 2)信用卡盗用检测 3)数字识别 4)语言识别 5)人脸识别 6)商品推荐 7)医疗诊断 8)股票交易 9)顾客区分 10)图形预测。
其实也是四大问题,
1)分类问题:数据被贴了标签,而且肯定属于某个类。例如垃圾邮件检测系统。
2)回归问题:数据拥有有个数值,而且这个数值与时间有关,例如股票的价格总是会在某个值上下波动,我们主要是为了预测下一个时间它的价格。
3)聚类问题:数据没有被贴上标签,但是它们其实是属于不同类的,我们需要给它们贴上标签。
4)发掘关系:有两个看似无关的东西,它们其实内在存在我们人类无法察觉到的关系。
典型的机器学习方法有两张:
1)监督学习
我们要去判断预测出来的东西对还是不对。
2)无监督学习
整个过程中没有人工参与。
原文:http://www.cnblogs.com/lw945/p/5965554.html