pagerank

PageRank 算法计算每一个网页的 PageRank 值,然后根据这个值的大小对网页的重要性进行排序。它的思想是模拟一个悠闲的上网者,上网者首先随机选择一个网页打开,然后在这个网页上呆了几分钟,跳转到该网页所指向的链接,这样无所事事、漫无目的地在网页上跳来跳去,PageRank 就是估计这个悠闲的上网者分布在各个网页上的概率。

PageRank 背后的两个基本假设:

数量假设:更重要的网页可能被更多的网页链接到。

质量假设:有更高的 PageRank 的网页将会传递更高的权重。


计算 转移矩阵(跳转概率)、初始矩阵(权重矩阵)

解决无出链接(每个网页概率为1/n)

解决环链接,随机跳转到其他概率

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。