该论文研究的是Open set domain adaptation问题,其中源域中没有未知类,而作者将目标域中的未知样本统称为一类:unknown class。本文提出分离适配(Separate to Adapt (STA)),一种端到端的开集域适配方法。这种方法采用由粗到细的加权机制,逐步分离未知类和已知类的样本,同时加权它们对特征分布对齐的影响,能够很好的在开放度变化较大的情境中得到较高的精度。
最通俗地讲:
\(G_c\):产生的初步权值来从目标域中区分出未知类
\(G_b\):进一步得到更精确的权重,将目标域的已知类与未知类精确区分
\(G_d\):将分离出来的目标域的已知类与源域的已知类进行对齐(因为此时已经消除未知类的影响)
实现对抗性自适应,使目标域中已知类的特征分布与源域保持一致,并利用未知类中的数据为额外类训练Gy
利用分离适配(STA)模型,可以有效分离目标域中已知类和未知类的数据。
step1拒绝异常值以避免在step2中分散未知类的注意力,而step2执行对抗性调整以使step1中的拒绝管道更准确。
由于在整个过程中不需要手动选择阈值超参数,所以在实际场景中,当开放度O变化时,可以避免参数的调整。
1.渐进式分离:作者分别使用\(G_c\)、\(G_b\)来进行由粗到细的过滤。
在开始的\(G_c\)中使用目标域的样本与源域的所有类别进行比较,得出相似性高的类别来代表该样本可能的实际类别,而相似性低的则代表未知类别(之前在源域的分类器中添加了一个unknown类,以此来初步区分已知未知);产生每个类的决策边界。
然后将相似性极高与极低的输入\(G_b\),进一步对样本进行精细分离。
2.加权适应:\(G_b\)二元分类输出的是一个w权值,当目标域的样本与源域更接近时w较小(已知类),反之较大(未知类)。在对抗域适应的loss中使用w权值能够更精确地进行源域域目标域数据地对齐。
3.对于模型的验证,作者使用了各种各样丰富地数据集进行了全方位的验证,Ablation Study也证明模型各个部件的决定性作用,而且实验还设置了不同开放度的数据集来测试模型的鲁棒性。
Separate to Adapt Open Set Domain Adaptation via Progressive Separation论文总结
原文:https://www.cnblogs.com/Jason66661010/p/13582999.html