首页 > 其他 > 详细

Google的Page-Rank

时间:2014-12-19 00:44:30      阅读:254      评论:0      收藏:0      [点我收藏+]

Page-RankGoogle最核心的算法,用于给每个网页价值评分,是Google“在垃圾中找黄金”的关键算法,这个算法成就了今天的Google

例如有四个网页,1有链接指向2342有链接指向343有链接指向44有链接指向2,如下图如示。矩阵S怎么来的呢:矩阵的每一行代表一个网页,每一列也代表一个网页;值为0表示没有链接,非0表示有链接。网页1中没有链接指向网页1,所以11列的值为0,网页1中有链接指向网页2,所以21列的值为非0,同理,31列、41列的值也为非0,最后21列、31列、413个非0平分网页1的权重值,即每个为
1/3;同理得出第234列的各个元素

bubuko.com,布布扣 

bubuko.com,布布扣
S 是源矩阵
U 是一个全部元素都是 1 的矩阵
n 是节点数量,以上图为例 n=4
α
是权重,值在 0 1 之间( google 的工程师会不时对其进行调整,使网页评分值更合理)
Ggoogle矩阵,nn

qG的特征向量,n1列,q中的第一个元素就是页面1的评分,以此类推


q怎么算呢,可以通过迭代来算出:
事先定义任意向量q1,然后开始迭代:G*q1=q2G*q2=q3G*q3=q4
 ,这样一直迭代下去一定会是收敛的(google已经证明),即到后面会有G*qn=qn+1,而qnqn+1之间的差别非常非常小。我们可以事先定义一个阀值,如里这个阀值小于qnqn+1之间的距离,就停止迭代,然后把qn+1拿过来近似作为特征向量q.

未完待续...


 

 

Google的Page-Rank

原文:http://my.oschina.net/zc741520/blog/357883

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!