批标准化(Batch Norm)

时间：2018-01-06 23:57:29 阅读：385 评论：0 收藏：0 [点我收藏+]

通过归一化输入值/隐藏单元值，以获得类似的范围值，可加速学习。
限制了在前层的参数更新会影响数值分布的程度，使层的输出更加稳定，神经网络的之后的层就会有更坚实的基础（减弱了后层的参数因前层参数发生变化而受到的影响） 减弱了前层参数的作用与后层参数的作用之间的联系，使得网络每层都可以自己学习，稍稍独立于其他层，有助于加速整个网络的学习。

对于Dropout来讲，给每个隐藏单元一定概率置零的可能，这样就相当于给网络引入了噪声。迫使Dropout后部单元不过分依赖于前面任何一个隐藏单元。

而BN，因为是在Mini-batch上计算mean、variance，而不是整个数据集上。均值和方差有一些小噪音，在进行缩放过程，γ、β也会引入噪声，这样和dropout类似，它往每个隐藏层的激活值上增加了噪音，所以起到了一定的正则化作用。

当mini-batch变大时，由于均值方差更加接近真实值，所以噪声会减小，就会减少正则化的效果。

原文：https://www.cnblogs.com/guoyaohua/p/8215710.html

踩

(0)

评论一句话评论（0）

分享档案

更多>