推荐一个链接(用Excel实现多种维度的卷积):https://medium.com/apache-mxnet/multi-channel-convolutions-explained-with-ms-excel-9bbf8eb77108
其中3维卷积是这样的:
我以前的错误理解:如果输出通道只有1个,那么就只有1个卷积核(例如3x3,也就是9个参数)。然后该卷积核对输入3通道分别卷积,得到3张特征图,pixel-wise相加即可。
错误的地方:如果输入是RGB 3通道,那么就有3个卷积核!实际上有3x3x3=27个参数。
PyTorch的官方文档验证了这一点:
其中weight不仅与输出通道index有关,还与输入通道index有关。即,如果有inC个输入通道,inO个输出通道,那么就有inC x inO个卷积核(也就是权重矩阵)。
原文:https://www.cnblogs.com/RyanXing/p/12852940.html