秒懂搜索引擎算法,就差此文
<p>再以往教程《<a href="https://www.teamczyx.com/tag/seo外链">SEO外链</a>》中都稀少讲了一点,但都不是很明确,也说道了百度<a href="https://www.teamczyx.com/seormjc/225.html">搜索引擎原理</a>的抓取,为了让大家更深层次了解内链与外链对网站的重要性。今天重庆SEO徐三就为大家介绍的是链接原理与搜索引擎算法,希望对大家有所帮助。
</p>
<p style="text-align:center;">
<img class="alignnone size-full wp-image-755" src="https://www.teamczyx.com/article/timg-1.jpg" alt="搜索引擎算法" width="600" height="436" title="?tle插图?m" />
</p>
<h2>
一、李彦宏超链分析专利
</h2>
<p>
<strong>1、超链分析</strong>
</p>
<p>
简单介绍下超链分析。超链分析是通过分析链接网站的多少来评价被链接的网站质量,这保证了用户在百度搜索时,越受用户欢迎的内容排名越靠前。
</p>
<p>
<strong>2、李彦宏超链讲解</strong>
</p>
<p>
1996年,李彦宏想到了如何解决搜索引擎作弊问题。以下是他对此的讲解。
</p>
<blockquote>
<p>
我想到了我在北大所学的科技论文索引,科学论文通过索引被引用次数的多寡来确定一篇论文的好坏,超链就是对页面的引用,作弊网页没价值,不可能被很多网站主动超链。
</p>
<p>
超链上的文字就是对所链接网页的描述,通过这个描述可以计算出超链和页面之间的相关度。
</p>
<p>
超链是别人评价你,超链上的描述是别人怎样评价你。
</p>
</blockquote>
<p>
<strong>3、从李彦宏超链分析学到什么</strong>
</p>
<p>
高权重的网站给予的评价是积极的和正面的,是对另外一个网站的褒奖。一般权重的网站给予的评价在一定程度上也是对网站的肯定,可这种效果远远不如高权重网站,而且是越来越不如。垃圾网站、或黄|赌|非法类网站给予的评价,很可能会网站造成惩罚。
</p>
<p>
这就是告诉我们,高权重网站的外链依然有效,垃圾外链不如不做。
</p>
<h2>
二、Google PR
</h2>
<p>
<strong>1、简单介绍PR</strong>
</p>
<p>
PR,英文全称为“PageRank”,中文为“网页级别”。2001年,被授予美国专利。专利人是Google创始人之一拉里·佩奇(Larry Page)。故,PR中的Page本来不是页面,而是指佩奇。
</p>
<p>
PR级别是0~10,10为满分。PR值越高,代表着网页越受欢迎。由于SEO从业者太过重视PR,Google停止更新了PR值。所以,现在的新站的PR值均为0。
</p>
<p>
<strong>2、PR算法的基本思想</strong>
</p>
<p>
基本思想:如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。
</p>
<p>
这个重要性得分值为:PR(T)/C(T)
</p>
<p>
其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。
</p>
<p>
PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn))
</p>
<p>
A代表页面A
</p>
<p>
PR(A)则代表页面A的PR值
</p>
<p>
d为阻尼指数。通常认为d=0.85
</p>
<p>
t1…tn 代表链接向页面A的页面t1到tn
</p>
<p>
C代表页面上的外链接数目。C(t1)即为页面t1上的外链接数目
</p>
<p>
从计算公式可以看到,计算PR值必须使用迭代计算才能得到。
</p>
<p>
<strong>3、从PR中学到什么?</strong>
</p>
<p>
看不懂上面的PR解释也不要紧,至少我们知道,导出外链数越多,分得的PR值会越低。所以才有了交换<a href="https://www.teamczyx.com/tag/友情链接">友情链接</a>的时候,一定要注意对方的出链数量,如果过高,不建议交换。
</p>
<h2>
三、HITS算法
</h2>
<p>
<strong>1、HITS简介</strong>
</p>
<p>
HITS,英文全称“Hyperlink-Induced Topic Search”,中文为“超文本敏感标题搜索”。1997年,Jon Kleinberg 博士提出的。
</p>
<p>
<strong>2、HTIS原理简单介绍</strong>
</p>
<p>
HTIS算法与Google PR不同的是:仅考虑专家页面的链接。主要包括两个步骤:专家页面搜索和目标页面排序。
</p>
<p>
HITS算法是利用HubPAuthority的搜索方法。
</p>
<p>
将查询q提交给基于关键字查询的检索系统,从返回结果页面的集合中取前n个网页(如n=200),作为根集合(root set),记为S,则S满足:
</p>
<p>
1)S中的网页数量较少
</p>
<p>
2)S中的网页是与查询q相关的网页
</p>
<p>
3)S中的网页包含较多的权威(Authority)网页
</p>
<p>
通过向S 中加入被S 引用的网页和引用S 的网页,将S 扩展成一个更大的集合T. 以T 中的Hub 网页为顶点集V1 ,以权威网页为顶点集V2 。
</p>
<p>
V1 中的网页到V2 中的网页的超链接为边集E ,形成一个二分有向图. 对V1 中的任一个顶点v ,用h ( v) 表示网页v 的Hub 值,且h ( v)收敛;对V2 中的顶点u ,用a ( u) 表示网页的Authority 值。
</p>
<p>
开始时h ( v) = a ( u) = 1 ,对u 执行I 操作,修改它的a ( u) ,对v执行O操作,修改它的h ( v) ,然后规范化a ( u),h ( v) ,如此不断的重复计算下面的I操作和O操作,直到a ( u),h(v)收敛 。
</p>
<p>
其中I操作:a ( u) = Σh ( v) ;O 操作: h ( v) = Σa ( u) 。每次迭代对a ( u) 、h ( v) 进行规范化处理: a ( u) = a ( u)/Σ[ a ( q) ]2 ; h ( v) = h ( v)/Σ[ h ( q) ]2 。
</p>
<p>
<strong>3、从HTIS算法中学到了什么</strong>
</p>
<p>
HTIS算法更加说明了,获取权威网站外链的重要性。另外,如果不能成为权威网站,那么就成为枢纽页面,枢纽页面就是包含了很多权威页面的网站。
</p>
<h2>
四、Hilltop算法
</h2>
<p>
<strong>1、Hilltop算法</strong>
</p>
<p>
HillTop ,是一项搜索引擎结果排序的专利,2001年,Google的一个工程师Bharat发明。与Google PR类似,也是通过网页被链接的数量和质量来确定搜索结果的排序权重。
</p>
<p>
<strong>2、Hilltop优化之处</strong>
</p>
<p>
HillTop认为只计算来自具有相同主题的相关文档链接对于搜索者的价值会更大:即主题相关网页之间的链接对于权重计算的贡献比主题不相关的链接价值要更高。
</p>
<p>
<strong>3、从Hilltop中学到了什么</strong>
</p>
<p>
Hilltop算法告诉我们,获取网站外链时,相关性非常非常滴重要。
</p>
<h2>
五、TruskRank算法
</h2>
<p>
<strong>1、TruskRusk介绍</strong>
</p>
<p>
TruskRusk,中文译为“信任指数”,代表网站在Google上的信任度。TruskRusk值越高,代表网站质量越高。
</p>
<p>
<strong>2、TruskRusk出现背景和影响因素</strong>
</p>
<p>
由于搜索引擎在计算网页排名的时候,非常依赖链接,而且链接的质量越来越显得重要。很多<a href="https://www.teamczyx.com/tag/seo人">SEO人</a>利用外链作弊,Google为了找出反作弊机制,而发明。
</p>
<p>
影响因素有以下几项:
</p>
<p>
1)域名年龄5年及以上;
</p>
<p>
2)空间为专用服务器,非虚拟空间;
</p>
<p>
3)网站打开速度快;
</p>
<p>
4)网站内容为原创;
</p>
<p>
5)访客在每个页面上驻留时间大于九十秒;
</p>
<p>
6)网站被多个国际IP段引用;
</p>
<p>
7)网站在其所属行业中拥有权威性。
</p>
<p>
<strong>3、从TruskRusk算法中学到了什么</strong>
</p>
<p>
虽然TruskRusk是为了检测垃圾外链的反作弊算法,但是这些近年来搜索引擎的百度算法而言,TruskRusk概念常常影响着现在网站的排名。如网站的打开速度等。
</p>
<h2>
六、搜狗SR
</h2>
<p>
<strong>1、SR评级简介</strong>
</p>
<p>
Sogou Rank是什么?网页评级(Sogou Rank)是搜狗衡量网页重要性的指标,不仅考察了网页之间链接关系,同时考察了链接质量、链接之间的相关性等特性,是机器根据Sogou Rank算法自动计算出来的,值从0至10级不等。网页评级越高,该网页在搜索中越容易被检索到。
</p>
<p>
在爱站网上搜狗的SR,被标识为搜狗PR,当PR停止更新后,搜狗的SR确实可以给予SEO人才分析链接关系提供一定的根据。
</p>
<p>
<strong>2、提高搜狗PR</strong>
</p>
<p>
为了提高您的页面的评级,您需要努力提升页面品质,让更多同领域的高评级站点来链接您的页面。同时您需要慎用您的对外链接,尤其是对低质量站点的链接(如果链接到垃圾站点,将极有可能降低您的网页评级)。
</p>
<p>
<strong>3、从搜狗RP算法中学到了什么</strong>
</p>
<p>
搜狗PR或者说SR也是页面评级的一种途径,低质量外链可能会影响网站的评级,<a href="https://www.teamczyx.com/seogjjc/346.html">高质量外链</a>会提高网站的评级。
</p>
页:
[1]