原文链接:https://mp.weixin.qq.com/s/svo0_mJ0RwOUA7hgc0doCw
论文链接:https://arxiv.org/abs/1911.00068
带噪学习:https://github.com/subeeshvasu/Awesome-Learning-with-Label-Noise
开源工具:https://github.com/cgnorthcutt/cleanlab
错误标注很普遍,如下图所示,QuickDraw、MNIST和Amazon Reviews数据集中就存在错误标注。
置信学习三个步骤:
Count包括四步骤:
Clean有4种方法:
Re-Training
本方法和置信学习中的SOTA方法Mentornet相比,噪声数据占比40%时,多组实验平均提升34%。
《别让数据坑了你!用置信学习找出错误标注》作者:JayLou娄杰。置信学习/带噪学习
原文:https://www.cnblogs.com/CheeseZH/p/13238446.html