互联网中的图数据:
社交关系、知识图谱、行为关系图
基于图数据的 Graph Embedding 方法:
1基于随机游走的Graph Embedding 方法(注意:DeepWalk 的跳转概率就是跳转边的权重占所有相关出边权重之和的比例):
2.同质性与结构性权衡的方法,Node2Vec:
同质性:距离相近节点,embedding相似,利用DFS,多次跳转到达远方,则同社区的节点相似度高
结构性:结构类似的节点,embedding相似,利用BFS,利用序列信息可获得其在结构中的位置
利用节点的跳转概率控制跳转的亲倾向性:
结构性和同质性获得embedding是从不同侧面对图特征的挖掘,可以同时输入模型当中。
Embedding如何应用到推荐系统中的 ?
1.embedding是一种处理特征的方式
2.1)直接应用:利用embedding的相似性进行推荐
2)预训练应用:将embedding作为特征的一部分,利用模型训练
3)End2End应用:
重点总结:
你能尝试对比一下 Embedding 预训练和 Embedding End2End 训练这两种应用方法,说出它们之间的优缺点吗?
Embedding预训练:优点:快(独立训练),难以收敛(分开训练,对效果没有提升)
原文:https://www.cnblogs.com/marklong/p/14223157.html