PageRank(PR)是一种数学公式,通过查看链接到页面的其他页面的数量和质量来判断“页面的价值”。其目的是确定给定网页在网络(即万维网)中的相对重要性。
谷歌联合创始人谢尔盖·布林 和拉里·佩奇 于1997年设计了PageRank,作为斯坦福大学研究项目的一部分。他们描述了他们的动机如下:
“我们的主要目标是提高网络搜索引擎的质量。”
这带来了一个重要的观点:搜索引擎并不像Google今天那样高效。雅虎和Altavista等早期搜索引擎根本无法正常运行。他们的搜索结果的相关性还有很多不足之处。
以下是谢尔盖和拉里在原始论文中对搜索引擎状态的评价:
“最近使用搜索引擎的任何人都可以很容易地证明索引的完整性不是搜索结果质量的唯一因素。“垃圾结果”经常会清除用户感兴趣的任何结果。“
PageRank旨在通过利用“网络的引用(链接)图表”来解决这个问题,这两个人称之为“在现有网络搜索引擎中大部分未被使用的重要资源”。
这个想法的灵感来自科学家评估科学论文“重要性”的方式。也就是说,通过查看引用它们的其他科学论文的数量。Sergey和Larry采用了这一概念,并通过跟踪网页之间的引用(链接)将其应用于网络。
它非常有效,它成为我们现在称为Google的搜索引擎的基础,它仍然是。
pagerank算法原理
这是 1997年发表的原始论文中的完整PageRank算法公式(和解释):
我们假设页面A具有指向它的页面T1 … Tn(即,引用)。参数d是阻尼系数,可以设置在0和1之间。我们通常将d设置为0.85。关于d的更多细节将在下一节中介绍。此外,C(A)被定义为从页面A出来的链接数。页面A的PageRank如下:
PR(A)=(1-d)+ d(PR(T1)/ C(T1)+ … + R(Tn)/ C(Tn))
请注意,PageRanks在网页上形成概率分布,因此所有网页的PageRanks总和为1。
困惑?让我们简化一下。
在计算网页的PageRank算法时,Google会考虑以下三个因素:
-
入站链接页面的数量和质量;
-
每个链接页面上的出站链接数;
-
每个链接页面的PageRank。
比方说,第C 有两个环节:一个从网页A ,一个来自网页B。页面A 比页面B强,并且输出链接也少。将此信息提供给PageRank算法,您将获得第C页的PageRank 。
PageRank公式还有一个所谓的“阻尼因子”,它模拟随机用户在浏览网页时继续点击链接的概率。每次链接点击都会减少这种情况。
可以这样想:您点击访问的第一页上的链接的概率相当高。但是,您在下一页上单击链接的可能性略低,依此类推。
考虑到这一点,对于PageRank算法的每次迭代,页面的总“投票”乘以“阻尼因子”(通常假设为0.85)。
如果BBC通过四个“链接跳跃”链接到页面,则该链接的值将“衰减”到最终页面几乎不会感觉到好处的程度。但如果他们只通过两个链接跳转链接到同一页面,该链接将对页面产生强烈影响。
总结:大多数搜索引擎优化从来没有考虑过Google PageRank,原因显而易见:它已经过时了,即使您愿意,也无法再查看页面的PageRank。
但重要的是要记住,PageRank公式是当今许多SEO最佳实践的核心。这就是为什么反向链接很重要的原因,也就是为什么搜索引擎优化专业人士仍然非常关注内部链接。
这并不是说您应该过度思考,甚至??尝试直接针对PageRank进行优化。你不应该。但要明白,无论何时构建链接,处理内部链接结构,或审查外部链接。你实际做的是间接优化PageRank。
|