扫码关注下方公众号:"Python编程与深度学习",领取配套学习资源,并有不定时深度学习相关文章及代码分享。
今天分享一篇发表在CVPR2020上的关于医学图像处理的论文:Structure Boundary Preserving Segmentation for Medical Image With Ambiguous Boundary (论文链接)。
当前医学影像分割任务存在两个关键问题:
这篇文章针对上述问题提出了解决方案,主要有如下三点贡献:
文中的模型效果如下图,相比于U-Net,作者提出的模型能够更好的处理分割区域的边界。
如上图(Figure 2)所示,整个模型可以分解为三个主要部分:分割网络、边界保持模块(Boundary Preserving Block, BPB)以及形状边界判别器(Shape Boundary-aware Evaluator, SBE)。
分割网络: 可以由流行的语义分割网络构成,例如U-Net等。
边界保持模块: 该模块能够嵌入到卷积网络中,其思想是在卷积模块中,根据其输入特征产生对应的边界点图,而后将边界点图融入到下一个卷积模块的特征输入中,同时边界点图做一个监督学习。(感觉有点类似中间监督+注意力机制)
形状边界判别器: 模型最终产生的分割图预测与中间卷积模块中产生的边界点图可以通过形状边界判别器来约束它们之间表达的一致性。
这篇文章的创新主要在于边界保持模块和形状边界判别器,后面将主要对这两个模块进行介绍。
由于文中采用边界关键点来表示目标边界,因此在介绍边界保持模块之前,需要先了解怎么选择边界关键点。文中边界关键点选择算法的具体过程是:
上述的过程写成算法形式就如Algorithm 1所示:
上图(Figure 3)展示了如何在卷积网络中嵌入BPB模块,以达到在预测分割图的过程中将边界关键点考虑进去。具体地,假设现在是第$i$个卷积模块,模块的输入特征维度为$f^i\in \mathbf{R}^{w^i\times h^i\times c^i}$,BPB的过程为:
这个过程可写成如下公式:
$$v^i=f^i\oplus(f^i \otimes \hat{M}^i)$$
Figure 3中需要注意的还有$\hat{M}^i$的生成过程,将并行的多路空洞卷积(the dilated convolution)产生的特征连接起来,再进一步做边界点图的预测,用公式表达如下:
$$\hat{M}^i=\sigma\left (d_1^1\{[d_1^1(f^i),d_1^3(f^i),d_2^3(f^i),d_4^3(f^i),d_6^3(f^i)]\}\right )$$
其中$d_r^s(f^i)$表示空洞率(dilation rate)为$r$,卷积核大小为$s\times s$的空洞卷积函数(dilated convolution function)。
采用上述的BPB模块嵌入到卷积网络中其实已经可以达到结构边界保持的目的了,但可能存在问题:模型预测的边界点图和模型预测的分割区域可能不是很匹配,比如某一些点虽然在边界点图预测正确了,但最终预测却缺失了。为了解决这个问题,文中提出了SBE,SBE是一个二分类器,其输入是边界点图和分割图,输出为一致性分数,高分即一致,低分则不一致。我的理解是相当于在预测边界点图和预测分割图之间加了约束,使得模型能够产生更优质的预测结果。
综合上述的分析,文中提出的模型会产生3个部分的预测:分割图预测、各个卷积模块对应的边界点图预测、SBE的预测。因此损失函数由这三部分的损失函数组成,表示为:
$$L_{Total}=L_{Seg}+L_{BA}+\sum_{i=1}^lL_{Map}^i$$
其中$L_{Seg}$为预测的分割图的损失函数:
$$L_{Seg}=-S_{GT}\cdot log\left (\hat{S}_{Pred}\right )-(1-S_{GT})\cdot log\left (1-\hat{S}_{Pred}\right )$$
$L_{Map}^i$表示预测的边界点图的损失函数:
$$L_{Map}^i=-M_{GT}^i\cdot log\hat{M}^i-(1-M_{GT}^i)\cdot log(1-\hat{M}^i)$$
$L_{BA}$为作用在SBE预测结果上的损失函数:
$$L_{BA}=-log\left(D(\hat{S}_{Pred};M_{GT}) \right)$$
其中$D(\cdot)$表示SBE接收分割图和边界点图作为输入并产生预测分数。
这里我只给出论文中的定量和定性分析的表格或者图片,具体的结果分析可以看原文。
[1] http://openaccess.thecvf.com/content_CVPR_2020/papers/Lee_Structure_Boundary_Preserving_Segmentation_for_Medical_Image_With_Ambiguous_Boundary_CVPR_2020_paper.pdf
[2] John Canny. A computational approach to edge detection. IEEE Transactions on pattern analysis and machine intelligence, (6):679–698, 1986. 4
Structure Boundary Preserving Segmentation for Medical Image With Ambiguous Boundary(理解)
原文:https://www.cnblogs.com/CZiFan/p/13168977.html