同一个网页有多个快照的原因
很多朋友都遇到过不同的搜索词或搜索方式,获取同一网页百度快照的时间可能不同。 百度搜索“www.xunruicms.com”和“Xunruicms”得到
迅睿cms官方网站首页的快照,可以看到快照时间不一样。
搜索引擎更新索引的过程不是用新索引替换旧索引的过程。对于一个重要的网页,百度可以同时保留它的多个版本的快照。使用不同的搜索词获得的同一网页的即时版本可能不同。
如果两次搜索使用共同的搜索词,但同一网页的抓取时间不同,一般的原因是搜索引擎会在多个版本快照中优先推荐最匹配用户搜索词的那个。由于页面内容发生了变化,关键字的相关性可能会有所不同,当有多个版本的快照时可能会出现这种情况。当然,这不是唯一的原因,可能还有其他未知因素。
如果上述情况之一是搜索常用关键字,另一种是搜索网址,并且同一网页的快照出现时间不同,除了上述原因外,还可以在上一章中提到在搜索引擎的原理上,搜索、百度缓存快照版本和索引库中的快照版本是不一样的。用户搜索常用关键词时,因为之前有人搜索过,百度直接从缓存中检索快照;用户查找网址时,百度不使用缓存中的快照,而是使用索引库中的快照。结果,同一页面的两个快照出现在两次搜索中。根据观察,直接搜索网页网址通常会得到该网页最新版本的百度快照。目标关键字搜索偶尔会显示目标网页快照在较早的时间停止。