首页 > Web开发 > 详细

How much Position Information Do Convolutional Neural Networks Encode?

时间:2020-01-30 18:43:48      阅读:65      评论:0      收藏:0      [点我收藏+]

知乎上看到一篇博客https://zhuanlan.zhihu.com/p/99766566,讨论cnn中位置信息是如何学到的,感觉挺有意思的,就看了一下原文,

简单记录一下几个实验部分。

1、位置信息来自预训练模型

 作者分别用预训练权重的vgg,resnet和posenet来对比,发现用了预训练权重的vgg和resnet提取的位置信息更准确。但这个实验我

觉得设计的不合理,真正对比实验应该设计的是,用预训练权重的vgg,resnet对比随机初始化的vgg,resnet,而不是和单层的posnet来对比

2、大的卷积核和更多的层数,能获得更准确的位置信息

    更多的层数就不用说了,更大的卷积核也符合light head rcnn中得到的结论的,在某层中使用大的卷积核,效果更好。

3、位置信息存放在那一层

   原文分别用5层特征来对比,最后发现越深的特征,结果越准确。

4、位置信息来自哪里

 这篇文章的核心,作者认为来自于padding,并设计了几组对比实验(包括检测分割任务):加padding的准确率比不加的准确率要高很多。

  

How much Position Information Do Convolutional Neural Networks Encode?

原文:https://www.cnblogs.com/573177885qq/p/12243233.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!