网站翻页注意事项
1.不要盲目更改列表页面
在普通网站上,翻页是必不可少的,某些网站类别的信息列表可能长达数千页。过多的分页会妨碍Spider 对网站的抓取。如果网站刷新速度不是很快,长时间积压的分页过多,Spider几乎把列表上的所有东西都爬了一遍,这不是什么大问题。但是,对于每天更新的网站或网站目录,每天可能会产生几十页以上的列表内容或信息,给Spider爬取网站内容造成了障碍。
如图5-15 展示了某分类信息网站的分页。如果排名每天发布的信息超过10页,如果蜘蛛要爬10页后的新信息,应该转向下一页的URL只能在第10页提取,越低的页,越难获得。因此,为了方便搜索引擎抓取分页内容,分页可以采用以下两种格式:
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 21, 31 .
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10下一页
分页也可以按日期作为文件完成,具体取决于网站类型。创建一个日常信息或内容文件,然后将信息分页放入文件中,这样Spider就可以更轻松地捕获新的网站内容。如图5-16 显示了八方资源网提供商频道列表中使用的文件格式。
请注意,网上有很多帖子强烈推荐使用这种分页格式,但如果网站每天更新的信息不足以一页列表,普通的分页就可以了,没有必要特意按照这个格式。这种格式的目的是让Spider 每天都能轻松捕捉新内容。如果Spider 可以轻松捕获它,他为什么还要麻烦技术人员做同样的事情?作为一个SEO人,你需要了解每一个变化和设置的原理,而不是盲目跟风。任何SEO 策略都有适用的先决条件。
通常,网站将具有主目录和其他条件的汇总列表。主目录的主要目的是让Spider 能够轻松抓取整个站点的内容。房源首页还具有竞争关键词排名的作用;聚合列表通常只需要首页就可以竞争排名。所以上面的翻页是针对父目录的,添加列表中的翻页链接可能会被JS取消关注或调用,甚至直接取消分页。无需为Spider 设置多个门户来获取网站内容,也可以减少不必要的重量浪费。
2.注意第一页和“第一页”
很多网站都有这样的问题:列表首页的URL是一个目录,但是首页的内容和列表第一页的内容完全一样,两个URL在站点中并存,导致URL标准化问题。这时候一般有两种解决方案。一种是将分页的第一页301放在列表第一页的URL中,或者直接使用列表第一页的URL来制作第一页的URL(类似“/Pn1”)没有出现在网站上,二是为列表第一页设计了一个单独的页面,不重复列表第一页的内容。这两种方法都可以解决这个问题。第一种方法稍微简单一些,也是最常用的,但是第二种方法可以用来设计更多的关键字。主页和列表的第一页都可以获得更多的内部链接。权重,可能有能力承担更多关键字排名。
3.不要翻页浪费内容
很多网站为了增加网站的PV,为一篇文章配置了大量的页面,但是这些页面的标题并不完全相同或者只是在首页的标题后添加了一个页码。几乎只有文章的第1 页可以被搜索引擎收录和排名。因为每个标签的内容不同,但标题是一样的,虽然搜索引擎可以识别标签,但网站浪费了更多的收录和排名机会。因为每个页面的内容不一样,所以可以为每个页面制作不同的标题,这样不仅可以吸引用户浏览页面内容,还可以将每个页面作为一个单独的页面进行排序.不同的关键词。