应用:
对于网页检索结果进行排序
核心思想:
指向一个网站的链接越多,这个网站就越重要;如果一个网站被一些很重要的网站指向,那么这个网站也很重要。
PageRank 最简单的公式:
u 是一个网页,Bu 是指向u 的所有网页的集合,R 为最简单的PageRank 值,c 为标准化因子(0<c<1 ),Nv 为v 指向其他网页的总链接数量。
遇到的问题:
(1 )一些网页没有外链
(2 )一些网页构成循环
解决:
增加E ,其中E(u) 为第u 个网页的逃脱因子。
矩阵表示为
当u 有指向v 的链接则Au ,v 为1/Nu ,否则为0 ,令||R’||1 = 1 ,1 为全1 的向量
PageRank 计算:
总结:
PageRank 通过网页的超链接关系计算得到,有效地提高了检索的效率。