首页 > 其他 > 详细

CNN 卷积神经网络中的接受视野（Receptive Field）

时间：2020-04-06 20:23:16 阅读：228 评论：0 收藏：0 [点我收藏+]

RF （receptive field）描述了两个特征映射（Feature Maps）上神经元的关系，在进行 CNN 可视化的过程中非常有用。他也可以从侧面让我们了解，

为什么神经网络偏向于选择小的 Filter 和 Stride。假设，A 经过一系列的操作之后得到 B，那么 B 上的一个区域就只和 A 上的一个区域相关。

技术分享图片

一个输入大小为 11×11的A，经过一个过滤器大小为 3×3，步长为 1 的卷积核卷积之后，得到一个大为9×9的特征映射。

可以看到在 B 中一个 3×3 的区域，在 A 中的感受视野为 5×5。B 经过一个大小为 3×3 ，步长为 1 的卷积核卷积之后，得到一个 7×7 的特征映射。

因此在 A 中的一个 1×1 的区域在 B 中的视野就为 3×3。因此，C 中一个 1×1 的区域在 A 的视野就为 5×5。

计算公式为： $技术分享图片$

其中 $技术分享图片$ 表示第 i 层输入的一个区域， $技术分享图片$ 表示第 i 层的步长， $技术分享图片$ 表示第 i 层卷积核的大小（filter size）。此计算不需要考虑 padding size。

高层在低层中的视野

计算 C 在 B 中的视野

如我们想计算 C 的一个 1×1 的区域在 B 上的接受视野，从上图可以知道一共三层（两个卷基层一个输入层，此处将输入层的 i 当做0处理），此时我们求的是 $技术分享图片$ 在 $技术分享图片$ 上的感受视野。

由上图可以知道， $技术分享图片$ 的值为 1 因为第一层的步长为 1 ； $技术分享图片$ 的值为 3 ，因为卷积核的大小为 3×3；此时选择的 $技术分享图片$ 区域大小为 1×1，因此它的值为 1 。

通过上述公式计算可得： $技术分享图片$

即 $技术分享图片$ 在 $技术分享图片$ 的接受视野为 3×3 的区域。

计算 B 在 A 中的视野

计算 B 中一个 3×3 的区域在 A 中接受视野。可知 $技术分享图片$ 为 1； $技术分享图片$ 为 3，因为我们选择的 B 的区域为 3×3； $技术分享图片$ 为 3。

因此 B 在 A 中的接受视野为： $技术分享图片$

计算 C 在 A 中的视野

计算 C 中一个1×1的区域在 A 中的接受视野。

通过以上的计算，我们可以通过如下过程推断：

计算 C 在 B 中的接受视野

$技术分享图片$

2.计算 B 在 A 中的接受视野

此阶段需要将上面计算出来的结果当做 B 中需要计算的区域，因此就有：

$技术分享图片$

因此可以得到 C 中一个 1×1 的区域在 A 中的接受视野为 5×5

注：以上的计算适用于卷积层和池化层，在激活层中 $技术分享图片$

技术分享图片

conv5: $技术分享图片$

conv4: $技术分享图片$

conv3: $技术分享图片$

pool2: $技术分享图片$

conv2: $技术分享图片$

pool1: $技术分享图片$

conv1: $技术分享图片$

因此第5层卷积在输入层的感受视野为 163。

CNN 卷积神经网络中的接受视野（Receptive Field）

原文：https://www.cnblogs.com/tingtin/p/12643725.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！