人亦已歌 发表于 2023-6-24 09:43:26

优化带你懂得网页涌现作弊技巧的解决方法

<p>
        &emsp;&emsp;关于搜索引擎优化,大家应当都比较明确,它关系到了一些什么排名因素,我们知道排名不是说说就能做上去的,还需要消费时间消费精力去完成,但也有一些想不劳而获,轻轻松松就想排名做上去的人,它们就会想着采用一些不科学手段来提升,这就是一种作弊行动,那我们应当怎么去处理呢?就让小编带你懂得网页涌现作弊技巧的解决方法。
</p>
<p>
        &emsp;&emsp;一、网页反作弊涌现背景
</p>
<p>
        &emsp;&emsp;出于商业利益的驱使,很多网站站长会针对搜索引擎排名进行分析,并采用一些手段来提升排名。这种行动本身无可厚非,很多优化行动都是符合搜索引擎排序规矩的,但与此同时也存在很多恶意的优化行动。所以网页反作弊,也是目前所有商业搜索引擎需要解决的重要难点。
</p>
<p>
        &emsp;&emsp;二、网页作弊类型内容作弊:
</p>
<p>
        &emsp;&emsp;从大的分类来说,重要的作弊方法包含:内容作弊、链接作弊、暗藏作弊及近几年兴起的web2.0作弊方法。笔者认为,内容作弊与现阶段业务息息相干,因此会在本文着重讲下此类型及相干的反作弊思路。
</p>
<p>
        &emsp;&emsp;内容作弊的目标是通过精心更改或者调控网页内容,使得网页在搜索引擎排名中获得与其网页不相称的高排名。常见的作弊方法包含:要害词重复、无关查询词作弊、图片alt标签文本作弊、网页标题作弊、网页重要标签作弊及网页元信息作弊。通过这几种常见的作弊手段,作弊者的作弊意图不外乎以下几种:
</p>
<p>
        &emsp;&emsp;1、增长目标作弊词词频来影响排名;
</p>
<p>
        &emsp;&emsp;2、增长主题无关内容或者热门查询吸引流量;
</p>
<p>
        &emsp;&emsp;3、要害地位插入目标作弊词影响排名。
</p>
<p>
        &emsp;&emsp;Google在2011年2月高调发布针对低质量网页内容调剂排序算法,据报道此算法影响了大约11.8?网页排名,而这项调剂措施是专门针对以Demand Media(创立于2006年5月,雇员500人,它的业务比较复杂,包含域名注册、内容广告交易等。它的一个重要业务是,它有包含65个社会化媒体组成的网站群。)网站为代表的内容农场作弊伎俩的。
</p>
<p>
        &emsp;&emsp;内容农场的运营者便宜雇佣大批自由职业者,支撑他们付费写作,但内容广泛质量低下,很多文章都是通过复制黏贴完成。但重点是,他们会研究搜索引擎的热门搜索词等,并有机的将这些词汇添加到写作内容当中去。这样,普通搜索引擎用户在搜索时,会被吸引进内容农场网站,通过大批低质量内容吸引流量,内容农场可以赚取广告费用。
</p>
<p>
        &emsp;&emsp;与传统的作弊方法相比,内容农场不采用机器拼接内容等机械方法,而是通过雇佣人员写作,这种作弊方法搜索引擎往往难以给出是否作弊的明确界定,但又严重影响搜索成果质量,所以是一种很难处理的作弊伎俩。
</p>
<p>
        &emsp;&emsp;三、网页反作弊技巧的整体思路:
</p>
<p>
        &emsp;&emsp;目前搜索引擎作弊手段五花八门且层出不穷,作为应对方的搜索引擎,也相应调剂技巧思路,所以如果收拾一下反作弊思路,则会创造技巧方法很多,理清思路着实不易。尽管如此,如果对大多数反作弊思路深入分析,会创造整体思路上还是有规律可循。从基础思路角度看,可以将反作弊手段大致划分为以下3种:信任流传模型、不信任流传模型和异常创造模型。
</p>
<p>
        &emsp;&emsp;1、信任流传模型:在海量的网页数据中,通过必定的技巧手段或人工半人工手段,从中筛选出部分完整值得信任的页面(可以懂得为我们日常所说的白名单),算法以这些白名单内的页面作为出发点,赋予白名单内页面节点较高的信任度分值,其他页面是否作弊,要根据其与白名单内节点链接关系来断定。白名单内节点通过链接关系将信任度分值向外扩散流传,如果某个节点最后得到的信任度分值高于必定的值,则认为没有问题,如果低于这个值则会被判为作弊。
</p>
<p>
        &emsp;&emsp;2、不信任流传模型:从大的技巧框架来讲,与信任流传模型极其类似。最大的差别在于:初始页面自己不是值得信任的页面节点,而是确认存在作弊行动的页面集合(即我们日常所说的黑名单)。赋予黑名单内页面节点不信任分值,通过链接将这种不信任关系流传出去,如果最后页面节点的不信任分值大于设定的那个值,则被判为作弊。
</p>
<p>
        &emsp;&emsp;3、而异常创造模型:简略的譬如分析网页内容来创造词频、链接等的异常,复杂点的像分析网站用户行动异常等。异常创造模型往往和信任流传模型和不信任流传模型进行组合处理。
</p>
<p>
        &emsp;&emsp;事实上,纯粹技巧手段目前是无法彻底解决作弊的问题,因此现在一般都是用户在浏览搜索成果甚至是上网浏览时举报作弊网页,搜索引擎公司内部会有专门的团队来审核与主动创造可疑页面,经过审核确认的网页则可以放入黑名单或者白名单当中。综上所述,必须将人工手段与技巧手段相互联合,才干取得较好的反作弊效果。
</p>
<p>
        &emsp;&emsp;四、通用链接反作弊方法:
</p>
<p>
        &emsp;&emsp;1、TrustRank 算法 (属于信任流传模型)
</p>
<p>
        &emsp;&emsp;2、BadRank 算法(属于不信任流传模型,据传是Google采用的反链接作弊算法。 注意:不要链接给作弊页面)
</p>
<p>
        &emsp;&emsp;3、SpamRank (属于异常创造模型)
</p>
<p>
        &emsp;&emsp;SpamRank 的基础假设是:
</p>
<p>
        &emsp;&emsp;3.1、对于正常页面来说,其支撑者页面的 PangRank 值应当满足 Power-Law 散布,即 PR值有大有小。
</p>
<p>
        &emsp;&emsp;3.2、作弊网页不同,一般具有如下3个特点:
</p>
<p>
        &emsp;&emsp;Ⅰ、支撑者页面数量非常宏大
</p>
<p>
        &emsp;&emsp;Ⅱ、支撑者页面的 PangRank 值得分都较低
</p>
<p>
        &emsp;&emsp;Ⅲ、支撑者页面的 PangRank 值都落在一个较小浮动领域内
</p>
<p>
        &emsp;&emsp;五、专用链接反作弊技巧:
</p>
<p>
        &emsp;&emsp;1、辨认链接农场:
</p>
<p>
        &emsp;&emsp;、网页出链的统计散布规矩,作弊网页出链不符合 Power-Law 散布
</p>
<p>
        &emsp;&emsp;Ⅱ、网页入链的统计散布规矩,作弊网页入链不符合 Power-Law 散布
</p>
<p>
        &emsp;&emsp;Ⅲ、URL名称统计特点,作弊网页的网址较长,包含更多的点画线和数字等
</p>
<p>
        &emsp;&emsp;Ⅳ、很多作弊网页的URL地址尽管不同,但是对应同一个IP地址
</p>
<p>
        &emsp;&emsp;Ⅴ、网页特点会随时间变更,比如入链的增长率、出链的增长率等
</p>
<p>
        &emsp;&emsp;Ⅵ、链接农场的结构特点,农场内的网页之间链接关系非常密切
</p>
<p>
        &emsp;&emsp;2、辨认 Google 轰炸:
</p>
<p>
        &emsp;&emsp;断定锚文字是否和被指向页面有语义关系
</p>
<p>
        &emsp;&emsp;六、辨认内容作弊:
</p>
<p>
        &emsp;&emsp;1、重复涌现要害词,断定文本内必定大小的窗口中是否持续涌现同一个要害词
</p>
<p>
        &emsp;&emsp;2、标题要害词作弊
</p>
<p>
        &emsp;&emsp;3、统计正常页面中句子长度的规律、停用词的散布规律、词性的散布规律等
</p>
<p>
        &emsp;&emsp;七、反暗藏作弊:
</p>
<p>
        &emsp;&emsp;常见的暗藏作弊方法包含页面暗藏和网页重定向。
</p>
<p>
        &emsp;&emsp;1、辨认页面暗藏
</p>
<p>
        &emsp;&emsp;对网页做2次抓取,第1次数正常的搜索引擎爬虫抓取,第2次模仿人工访问网页的方法抓取。这种方法成本非常高。
</p>
<p>
        &emsp;&emsp;2、辨认网页重定向
</p>
<p>
        &emsp;&emsp;Strider 系统给出了根据网页重定向来辨认到底哪些是作弊网页的解决方案。
</p>
<p>
        &emsp;&emsp;以上就是小编帮你们收拾的一些材料,关于搜索引擎优化,我们应当打压那些采用不科学方法上去的人,要做到公平性,不让辛苦都白费,尊重搜索的用户,净化互联网的生态环境
</p>
页: [1]
查看完整版本: 优化带你懂得网页涌现作弊技巧的解决方法