首页 > 编程语言 > 详细

数据分析算法--线性回归算法讲解

时间：2020-06-02 17:36:19 阅读：68 评论：0 收藏：0 [点我收藏+]

线性回归算法

什么是回归

1:分析银行贷款例子

技术分享图片

如图

2: 参数表达式

由需求可知,满足基本基本线性设定

技术分享图片

3:通俗解释

技术分享图片

4:通过数学解释

技术分享图片

由需求可知如果两个参数可以写成

技术分享图片

整合成数学公式为

技术分享图片

再转化成矩阵方式

5:分析误差

5.1公式假设

技术分享图片

技术分享图片

技术分享图片为差异 , 因为理论数据与真实值存在差异,该差异理论上可以为负数,可以为正数

技术分享图片

5.2 误差值详解

技术分享图片 误差包括

技术分享图片

技术分享图片

5.3高斯分布图

技术分享图片

从理论上将,银行贷款的金额普遍数据存在中间阶段 , 数据过小,或者数据过大的概率都相对较低

5.4 讲高斯分布的误差值带入假设式

假设高斯分布的均值为0 ,即数据集满足正态分布

技术分享图片

我们通过 y的真实值,和技术分享图片的预测值, 货物误差分布的值

5.5 似然关系

假设奖品数量无线个

如:10个人抽奖,前9个人抽到1等奖 ,第10个人抽到了2等奖,那么我就可以估计该奖品抽到的概率为90%

1: 似然函数

解释:似然函数就是以测试样品去估计参数值 ,参数估计

技术分享图片

即我们希望技术分享图片为0 最好 ,

使预测值等于真实值

技术分享图片

** 设定目标

我们使测定值为真实值得概率越高越好

2:对数似然

由上述似然函数, 累乘的方式获取数据,由于累乘的方式很难计算

我们以log 取低转成加法

技术分享图片

3:展开化简

由上述内容可知:

我们期望预测值值越大,越接近真实值

技术分享图片

公式分析

技术分享图片

取后半段变量数据

我们定义新变量

目标即为该表达式越小越好

技术分享图片

5.6 对公式求导求偏导取最小值

技术分享图片

求导

技术分享图片

其中x为矩阵 ,y为真实值

我们通过矩阵和真实值既可以获取偏导技术分享图片 ,该值可以再一般行情况下代表数据走向

6:评估公式

6.1 :评估方法

技术分享图片

技术分享图片

7:梯度下降

引子:

据上述操作可以获取偏移值 ,但是这个值不是在所有的情况下都是能求出来的.我们这里使用另外一种方式

1:引入

技术分享图片

我们不断测试斜率去取导数斜率最小值

技术分享图片

2:常规套路

技术分享图片

通过很多数据不断测试斜率取最优值

3:如何优化

技术分享图片

2:梯度下降详解

技术分享图片

技术分享图片

技术分享图片

技术分享图片

3:梯度下降方式

1: 目标函数

技术分享图片

2:常规下降方式

1:批量梯度下降

好处:精度最高

坏处:消耗资源,计算速度慢

技术分享图片

收敛方向好确定

技术分享图片

2:随机梯度下降

好处:计算速度快,不消耗资源

坏处:收敛方向不可控制

技术分享图片

收敛方向随机不可控

技术分享图片

3:小批量梯度下降法:

技术分享图片

4: 梯度下降如何控制

技术分享图片

技术分享图片

我们尽量选择最优梯度下降方案,

技术分享图片

数据分析算法--线性回归算法讲解

原文：https://www.cnblogs.com/baili-luoyun/p/13031071.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！