反向传播算法的微分详细证明过程

时间：2016-06-02 19:58:26 阅读：279 评论：0 收藏：0 [点我收藏+]

看了andrew ng 老师的机器学习教程，在关于反向传播算法进行讲解时，微分过程被省略掉了，只是说这个过程非常复杂。网上找了一些资料，有一篇比较详细的讲解，在http://axon.cs.byu.edu/resources/backprop_derived.pdf可以下载。这里也贴出来。微分过程中记法和andrew ng教程不太一样。不过貌似看着也蛮方便的。第20-24步的过程正好是δ反向传播的过程。

注意h(θ)这个假设函数，是关于输入向量的l层复合函数。

向量形式大概是这个样子 h(θ) = g(θ2 * g(θ1*xi ))，这里是一个三层神经网络的简单示意。其中g代表激活函数，andrew ng的示例使用的是logistic function作为激活函数。i代表输入层向量。θ1和θ2代表第一层和第二层的权重矩阵。n层的时候是类似的复合过程。求偏导的过程其实是E(h(θ), y)对θij求偏导的过程。

andrew ng老师的反向传播过程如图：

技术分享

它其实是20-24步过程的一个向量化的形式。

技术分享

反向传播算法的微分详细证明过程

原文：http://www.cnblogs.com/chyl411/p/5553999.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)