首页 > 其他 > 详细

机器学习基本概念简介

时间:2021-05-26 09:22:19      阅读:20      评论:0      收藏:0      [点我收藏+]

机器学习基本概念简介

1. 浅析机器学习

机器学习可以约等于找一个函数的能力,具备函数能力后可以做很多事情。例如:语音识别(1)、影像辨识(2)、下围棋(3)

(1)

技术分享图片

(2)

技术分享图片

(3)

技术分享图片

2. 不同类型的函数:

(1)Regression:输出是一个数值。例如:预测明天的PM2.5的量

技术分享图片

(2)Classfication:需要机器做的是选择题,我们预先准备一些选项(classes),机器从预设选项中选择一个当作输出。例如:垃圾邮件的侦测

技术分享图片

(3)Structured Learning:create something with structure(image,document)产生有结构的事物。通俗来讲,让机器学会创造。

3-1. 如何找到目标函数(以Youtube点阅人数预测为例)

技术分享图片

y:预测2月26日频道的总观看人数。(feature)

x1:2月25日频道的总观看人数。(feature)

w (weight)and b(bias):未知参数(想要从数据中获取的参数)

y = b+wx1 叫做model(模型)

3-2. 从训练数据定义损失函数(Loss)

(1)Loss is a function of parameters | L(b,w)| 损失函数是与b与w相关的函数 | 即把b和w设置为未知参数的时候,这组数值的好坏的衡量

(2)举例说明Loss(Label表示正确数值)

技术分享图片

依次类推,计算每天相较第二天的训练误差。

技术分享图片

(3)平均绝对误差和均方误差以及交叉熵计算法

技术分享图片

(4)Loss的等高线分布图(Error Surface:误差曲面)

技术分享图片

3-3 Optimization:最优解问题

1.找出效果最好的一组wbLoss的值最小。

技术分享图片

2.Gradient Descent(梯度下降)

(1)首先假设未知参数只有一个:w

技术分享图片

(2)获取不同的wLoss的关系

技术分享图片

(3)找到一个W使得Loss的值最小,首先随机挑选一个W0

(4)计算w = w0 这一点的切线斜率

(5)若w = 负值 —> 增加w

(6)若w = 正数 —> 减小w

(7)增加和减小的大小取决于该点斜率的大小和学习率的大小(hyperparameters表示人为设定的数值)

技术分享图片

(8)移动

技术分享图片

(9)停下的两种原因

人为设置了参数更新

计算得到的微分为0,参数不再移动

(10)存在问题:上述例子很显然可以发现梯度下降找到的不是最优的w,不是最优解的数值叫做local minima(局部最小值),真正的最优解是global minima(全局最小值)

技术分享图片

(11)拓展:local minima不是Gradient descent真正的问题

3.双参数引入

技术分享图片

技术分享图片

4.接下来的问题

我们需要知道的是未来的观看次数,所以要使用上述得到的函数获取未来的观看次数。

技术分享图片

(1)分析结果

横轴代表时间,纵轴代表观看的人数

真实数据每隔七天就会有两天特别低

技术分享图片

(2)修改模型(增加数据天数)

技术分享图片

以上所用的模型统称为Linear models

机器学习基本概念简介

原文:https://www.cnblogs.com/MurasameLory-chenyulong/p/14811721.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!