百度索引量与收录量是包含关系,我们认为的收录量是通过site指令查询的一个结果数,但这个数本身是实际索引量的一个预估值。所以收录量只是索引量的一部分。
百度索引量是什么(百度索引量下降的原因)
最早我们做SEO有个收录的概念,但后来由百度最先推出了一个索引量的概念。从这时开始,我们开始关注百度收录的同时也要关注百度索引量。那百度索引量和收录量是什么关系呢?
随便举个例子百度收录量是我们通过指令:site:www.cxta.com这样的形式,进行查询后得出的结果。而这实际上是百度索引量的一个估值。在之前百度没有推出可以查询索引量的工具时,我们只能通过这种方式来查询网站的大概收录量。
所以百度收录量site只是百度索引量的一个估值,是不准确的实际收录数据。
百度索引量是什么(百度索引量下降的原因)
什么是百度索引量?
先看百度的官方对索引量的解释:
网站中有多少页面可以作为搜索候选结果,就是一个网站的索引量。
网站页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。
目前site语法的数值是索引量估算值,比较不准。推荐站长们使用我们的新工具,同时我们也正在努力改进site语法。
根据如上解释,对索引量的解读
对于单个页面,搜索引擎通过抓取、数据处理等过程。将其存入到自己的数据库中。这样对单一页面的操作称之为建立索引。而一个站点有多少页面被建立索引了。就是我们本文说到的索引量。
我们可以通过site指令查询网站的收录量吗?
百度认为的收录,实际上是现在我们说的索引。而建立索引才是某网页被百度收录的实际结果。那么我们通过site指令查询到的所谓的收录只是百度的估值,真正的收录量是索引量。
百度索引量是什么(百度索引量下降的原因)
百度索引量和收录量什么关系?
那么现在我们也可以很明确。百度索引量与收录量是包含关系。收录量只是一部分的索引量,并不是全部。所以在未来的工作中,如果你想查询真正的百度收录量还是需要通过百度搜索资源平台的索引量工具进行查询。
百度索引量更新导致的下降,有两种情况一种是清除了下层索引数据但流量不会有影响,另外就是网站降权导致的大量索引被删除。徐三SEO带你探索百度索引量的奥秘。
我们在日常的工作中,难免会遇到在百度站长工具中看到自己网站的索引量突然下降了一大截。然后变得诚惶诚恐,找寻问题并想尽一切办法来解决这个问题。这无疑是百度索引量更新带来的一个结果。
百度索引量更新导致突然索引量大幅度下降,怎么办?
首先,我们要明白的是百度索引量为什么会更新,百度的索引量都是在索引库中进行存储的,而百度每天需要存入的数据量级十分的庞大。但只是存入数据,不删除数据。那势必会让百度购买更多的硬盘来扩展自己的存储空间。但这意味着巨大的成本支出。所以为了节省成本,百度会选择性的删除一些低质量无效数据。
至于删除什么数据,百度也按照上层索引、下层索引的方式做了分类。
上层索引:
1、高频被用户搜索到的,且又能满足一定用户需求;
2、大量链接指向的网页内的文本;
3、合规的网站首页等;
下层索引:
1、过时的新闻热点好久不会被搜索的;
2、质量低下,不能解决用户需求的;
3、被惩罚的站点或局部网页等;
这样,我们就知道了,百度索引量每次更新,删除的都是我们网站的下层索引。
当你下层索引被删除后,你的流量应该不会有太大的波动,甚至对流量都不会有影响。
比如徐三SEO之前的一个客户,页面体量达到了3千多万。在我做SEO顾问操刀的过程中,百度索引量更新,导致索引量锐减25?但流量反而是涨的。因为他们是做地方新闻门户的,很多的八卦、娱乐、时效性文章都已经过期很久了。早就不能带来什么流量了,删除了也不疼不痒。
所以如果你看到你网站的百度索引量突然下降,但排名和流量并没有影响,那就不用担心,观察一周后,还是如此就大可放心了。
网站降权导致的索引量下降
网站被降权导致的索引量下降,其根本问题不在索引。你主要的目的是要找到降权的原因,从而恢复它。徐三SEO这有一篇文章描述了锁定降权问题,并快速恢复的问题,如何判断是降权引起的呢?
1、索引量下降的同时,导致流量、排名也同趋势的下降;
2、百度索引量更新会涉及很多网站,如果只有你的索引量突然下降,那也是问题;
一般情况有第一种情况就可以断定了。第二种情况你可以通过一些5118工具,查看你知道的一些网站的索引量趋势数据。
robots设置,导致百度索引量下降
徐三SEO遇到的一个问题。搜索页面中,给很多的详情页都加了动态的统计参数。使一个网页多出了好多个网址来(www.cxta.com/1/html是一个网址,而www.cxta.com/1.html?a又是一个网址,但两个页面是同一个)。
这样导致百度索引了我大量的网页,同时我又担心会不会在计算页面重复度时降低我整站的质量得分(可以理解为权重)呢?于是我在robots文件中加了这么一句:
Disallow: /*?*
意思是所有后缀带问号的,全部不允许抓取。然后在这个改动上线后的一周后。但流量毫无变化。
甚至早期我在土巴兔时候日均百万级的站点,每天多个几千、少个几千都不能算增长和下降。所以在这种情况下,我一般都会彻底干掉了这些动态参数给我生成的大量垃圾页面。依然不影响流量的变化!喜欢本文的记得关注和转发。
|