深度学习论文阅读之旅（一）

时间：2020-03-26 21:55:36 阅读：72 评论：0 收藏：0 [点我收藏+]

0. 参考资料

对 CNN 的研究，目前集中在三个维度：channel， filter，和 residual。
目标是把模型做小、做强、做到移动端，精度差点，没关系，可以加数据，离线多跑几轮。

1. Channel

无论 Xception，还是 ResNeXt，还有面向移动端的 ShuffleNet 和 MobileNet。都是基于 Group Convolution思想在 channel 维度进行“网络工程”，搭建新的模型。

Xception 的核心思想是：Depth-wise Separable Convolution

1.1 Group Convolution

技术分享图片

1.2 Separable Convolution

在卷积层中间插入

所以说，理想的卷积 Block 应该是先用

技术分享图片

1.3 Xception

利用上述结构重新设计 Inception model block，就是 Xception；重新设计 Resnet，就是 ResNeXt 架构。以达到在减少参数量的情况下增加模型的层数，既减少了存储空间，还增强了模型的表达能力。

技术分享图片

通常来讲，如果对 channel 进行分组卷积，各小组就分头行动，互相没有交流，这样显然没有充分利用 channel 的信息。ShuffleNet 在分组之前，先将 channel 随记打乱，这样对信息的利用更充分，因此可以通过设计降低模型参数量而不影响模型的表达能力。

技术分享图片

2. Filter

2.1 Wavenet

经典 CNN 的 Filter 是在邻域内采样卷积，如

技术分享图片

但是，Filter 可以跨点采样进行卷积，从而可以利用更大范围内的信息，即 Dilated CNN，最早应用于图像语义分割，去年谷歌提出的 Wavenet 模型将 CNN 拓展到语音识别和语音合成。

技术分享图片

2.2 Dilated Resnet

将 Dilated CNN 的思想应用到 Resnet 架构中，就是 CVPR 2017 的 “Dilated Residual Networks”

技术分享图片

3. Connection

ResNet 的 Connection 方式是将输入和输出相加，形成一个残差 Block。DenseNet 则更进一步，在每个 Block 内，将输入和输出直接拼接，而且在每一层都和之前所有层的输出拼接，这样可以减少中间层的通道数。

技术分享图片

而最新的 Dual Path Networks 模型，则是融合了 ResNet 和 DenseNet 的优点：特征重利用和特征重提取。采用了双通道架构：
技术分享图片

可以预想，接下来，将会有模型融合以上三点的集大成者？

启发与思考

现在越来越多的 CNN 模型从巨型网络到轻量化网络一步步演变，模型准确率也越来越高。现在工业界追求的重点已经不是准确率的提升（因为都已经很高了），都聚焦于速度与准确率的 trade off，都希望模型又快又准。因此从原来 AlexNet、VGGnet，到体积小一点的 Inception、Resnet 系列，到目前能移植到移动端的 mobilenet、ShuffleNet（体积能降低到

卷积核方面：

大卷积核用多个小卷积核代替；
单一尺寸卷积核用多尺寸卷积核代替；
固定形状卷积核趋于使用可变形卷积核；
使用

卷积层通道方面：

标准卷积用 depthwise 卷积代替；
使用分组卷积；
分组卷积前使用 channel shuffle；
通道加权计算。

卷积层连接方面：

使用 skip connection，让模型更深；
densely connection，使每一层都融合上其它层的特征输出（DenseNet）

启发

类比到通道加权操作，卷积层跨层连接能否也进行加权处理？bottleneck + Group conv + channel shuffle + depthwise 的结合会不会成为以后降低参数量的标准配置？

深度学习论文阅读之旅（一）

原文：https://www.cnblogs.com/timssd/p/12577424.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

深度学习论文阅读之旅（一）

0. 参考资料

1. Channel

1.1 Group Convolution

推荐阅读：

1.2 Separable Convolution

1.3 Xception

2. Filter

2.1 Wavenet

2.2 Dilated Resnet

3. Connection

启发与思考

卷积核方面：

卷积层通道方面：

卷积层连接方面：

启发