Images Transform Net 的具体细节如下:
本文首先阐述了Style Transfer 和 Super Resolution 现阶段的发展。 提出了一个重要的概念--"Perceptual Loss". 指出其他的paper用Pixel loss 来计算相似度, 也就是 这个方法把Super -Resolution 的问题理解成了一个普通的MSE 回归问题。这篇文章指出了Pixel Loss 存在的缺点,其中一个缺点为 Pixel Loss 不能判断两张图像认知上的异同。
举个例子:两张一样的图像, 只不过图像A 的所有像素都比图像B往左偏移了一个像素。 这两张图像的Pixle loss 会非常大,但这两张图像应该被判定为相同。
然而用Perceptual loss 就能很好的克服这一问题。
Perceptual loss 借用了已经训练好的VGG-16这一网络。 把VGG-16网络的中间层activations作为目标,计算两个图像经过VGG-16中间层的两个activations 的欧氏距离。 可以用如下数学公式表达:
其中:
那么Perceptual loss 这数学公式就可以理解为两个图像在VGG-16中间层j的欧氏距离。 越小,说明VGG-16网络认为,这两张图越接近。
Perceptual Losses for Real-Time Style Transfer and Super-Resolution 论文理解
原文:https://www.cnblogs.com/h694879357/p/13347510.html