tensorflow(三十八)：Batch Normalization

时间：2021-05-02 16:56:31 阅读：31 评论：0 收藏：0 [点我收藏+]

一、不进行归一化，某些W变化对loss影响较大

技术分享图片

二、进行归一化

1、可以看到，Batch Norm结束后，只得到三个数值，每个通道一个。

技术分享图片

2、正常的Batch Norm过后，均值为0，方差为1，但是需要再加一个贝塔和伽马。（B,r）需要学出来。

技术分享图片

变成了均值为B，方差为r。

三、用法

1、下面的center是均值B，scale是方差r。最后一个参数用于测试时候。

技术分享图片

import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers, optimizers


# 2 images with 4x4 size, 3 channels
# we explicitly enforce the mean and stddev to N(1, 0.5)
x = tf.random.normal([2,4,4,3], mean=1.,stddev=0.5)

net = layers.BatchNormalization(axis=-1, center=True, scale=True,
                                trainable=True)

out = net(x)
print(‘forward in test mode:‘, net.variables)


out = net(x, training=True)
print(‘forward in train mode(1 step):‘, net.variables)

for i in range(100):
    out = net(x, training=True)
print(‘forward in train mode(100 steps):‘, net.variables)


optimizer = optimizers.SGD(lr=1e-2)
for i in range(10):
    with tf.GradientTape() as tape:
        out = net(x, training=True)
        loss = tf.reduce_mean(tf.pow(out,2)) - 1

    grads = tape.gradient(loss, net.trainable_variables)
    optimizer.apply_gradients(zip(grads, net.trainable_variables))
print(‘backward(10 steps):‘, net.variables)

tensorflow(三十八)：Batch Normalization

原文：https://www.cnblogs.com/zhangxianrong/p/14725679.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)