首页 > 其他 > 详细

deepwalk学习笔记

时间:2020-01-03 12:18:51      阅读:90      评论:0      收藏:0      [点我收藏+]

DeepWalk

简介

  1. 将节点表示为向量,保留网络结构信息

  2. DeepWalk将随机游走得到的节点序列当做句子,从截断的随机游走序列中得到网络的局部信息,再通过局部信息来学习节点的潜在表示。

  3. 可扩展、可并行、可处理稀疏网络

  4. 可对网络进行全局观察

    DeepWalk将一个图作为输入,并产生一个潜在表示(将图中的每个节点表示为一个向量)作为输出。

技术分享图片

 

 

 

 

 

 

算法要求

  1. 适应性:社交网络是不断变化的,当网络发生变化时,可对对整个网络新进行计算。

  2. 社区意识:节点在潜在表示的维度空间中的距离,应该表示网络中对应的成员的相似度,以此保证网络的同质性。

  3. 低维:当被标记的成员很少时,低维的模型一般表现的更好,并且收敛和推理速度更快。

  4. 连续性:需要通过图的潜在表示来对连续空间中的部分社区成员进行建模。除了提供对社区成员资格的细微视图之外,连续表示还可以使社区之间的决策界限平滑,从而实现更强大的分类。

算法大致思路

技术分享图片

1、随机游走

将从顶点Vi开始的随机游走序列表示为Wvi。Wvij表示序列Wvi中的第j个点。其中,Wvi1为Vi,Wvik+1是从Wvik的邻居中随机选择的节点。随机游走得到的序列中包含了网络的局部结构信息。

技术分享图片

 

当图中节点的度遵循幂律分布(y=cx-r,y是度数为r的节点的出现的频率;直观上说,就是度数大的节点比较少,度数小的节点比较多)时,短随机游走中顶点出现的频率也将遵循幂律分布。

因为自然语言中单词出现的频率遵循类似的分布,所以用于建模自然语言分布的技术,可以用于对随机游走得到的序列进行建模。

技术分享图片

 

1、容易实现并行性。几个随机游走者(不同的线程,进程或机器)可以同时探索同一网络的不同部分。

2、适应性。当图变化后,不需要全局重新计算,可以迭代地更新学习模型

2、语言模型

1. 语言建模的目标是估计出现在语料库中的特定序列的可能性。即给定

 

 

 

deepwalk学习笔记

原文:https://www.cnblogs.com/yyqxwh1128/p/12144232.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!