吴恩达《深度学习》第一门课（4）深层神经网络

时间：2019-08-16 01:19:58 阅读：121 评论：0 收藏：0 [点我收藏+]

4.1深层神经网络

（1）到底是深层还是浅层是一个相对的概念，不必太纠结，以下是一个四层的深度神经网络：

技术分享图片

（2）一些符号定义：

a^[0]=x（输入层也叫做第0层）

L=4：表示网络的层数

g:表示激活函数

第l层输出用a^[l]，最终的输出用a^[L]表示

n^[1]=5:表示第一层有五个神经元，第l层神经元个数用n^[l]表示

4.2前向传播和反向传播

（1）前向传播：输入a^[l-1],输出是a^[l],缓存为z^[l]，步骤如下：（下面第一个式子应该是a^[l-1]）

技术分享图片

向量化：

技术分享图片

（2）反向传播:输入da^[l],输出da^[l-1],dw^[l],db^[l]

技术分享图片

（4）da^[l-1]=w^[l]T·dz^[l]

由第四个式子带入到第一各式子中得

技术分享图片

向量化：

技术分享图片

（3）总结：第一层可能是Relu激活函数，第二层为另一个Relu函数，第三层可能是sigmoid函数（如果做二分类的话），输出值为a[L],用来计算损失，这样就可以以向后迭代进行反向传播就到来求dw[3],db[3],dw[2],db[2],dw[1],db[1].在计算的时候，缓存会把z[1]z[2]z[3]传递过来，然后回传da[2],da[1],可以用来计算da[0],但是不会使用它。整个过程如下图所示

技术分享图片