工作中遇到需要用迁移学习解决的风控问题:贷中模型,一个新的项目,如何冷启动。
1)目标域没有标签,即不知道未来是否逾期。2)没有足够的训练数据。
新项目的数据分布和旧项目不同,P(y|x) 假设相同, 但P(x)必定不同,此时需要用到密度比估计。估计出密度比之后,再对抽样后的源域数据进行训练,以达到在目标域上更好的效果。
基于样例的迁移学习:密度比估计的不可或缺性
原文:https://www.cnblogs.com/amydi/p/10530085.html