pandas算法的目标区域
谷歌历来提供关于熊猫算法如何工作以及它如何确定网站质量的模糊信息。例如,2011 年5 月6 日,Amit Singhal 提出了建立高质量网站的建议。其中,他建议对于一系列问题,您可以使用以下问题来检查您网站的状态。
您相信文章中的信息吗?
这篇文章的作者真的是该主题的专家还是粉丝?还是这篇文章本质上很肤浅?
本站大量相同或相同主题的文章是重复的,重复的还是重复的?这篇文章中的关键词是简单编辑还是编辑?
您是否愿意在本网站上提供您的信用卡信息?
本文中是否有拼写、格式或事实错误?
这个话题是由真正感兴趣的读者主导的吗?这些网站是否试图在生成内容时找出哪些内容在搜索引擎中排名靠前?
本文是否提供来自原创的信息内容、来自原创的报道、来自原创的研究或来自http://1281.cn的信息?/数据分析?
与搜索结果中的其他页面相比,此页面是否提供了更大的价值?
对这些内容进行了何种程度的质量控制?
这篇文章是否解释了故事的两面?
本网站是否由相关主题的权威机构认证?
这个内容是由多个编辑批量生产还是外包给多个编辑?还是分布在大量网络上?这些单独的页面或网站是否得到了足够的关注?
这些文章是否组织得井井有条?或者你认为它是仓促的还是仓促的?
本网站上的信息是否对健康相关的查询有说服力?
如果有人提到您的网站名称,该信息是否被视为可靠来源?
这篇文章是否提供了对该主题的完整、全面和深入的解释?
本文是否提供了有见地的分析或超出显而易见的有意义的信息?
想在分享收藏此类页面并推荐给您的朋友吗?
这篇文章是否包含大量广告?那么,您在阅读主要内容时是否分心或被打断了?
您想在印刷杂志、百科全书还是真书中阅读这篇文章?
这篇文章是否太短、缺乏内容或缺乏有用的细节?
这个页面是否产生了很多注重细节的内容?
用户在浏览本网站页面时是否有抱怨?
我们可以从这些建议中提取出几点,业界已经能够判断和澄清熊猫算法针对的领域。
稀薄的内容
正如您所料,这定义了一些内容很少或没有内容的页面。例如,一个论坛的用户文档页面在一些拥有数百万产品的商业网站上几乎没有信息,但每个产品的信息很少。
非原创内容
这是指已收集或很少重写的页面,可以很容易地被Google 检测到。我们网站上的任何上述类型的内容都可能被熊猫算法检测到。
无差别的内容
就算你把原创的所有内容都创造出来了,这还不够。如果您网站的每个页面都与其他人之前讨论过数千次的主题有关,您应该确保通过您的网站可以添加到互联网的内容不多。比如看谷歌收集的如何制作法式吐司的文章,网上有3万多页,上面写着“如何制作法式吐司”,比如如图9- 5.在标题中. 所以从谷歌的角度来看,不需要其他页面来继续讨论这个话题。
图9-5“如何制作法式吐司”有数万页。
低质量的内容
表示被认为不准确或低质量的内容。无论如何,这很难确定,但正如Amit Singhal 的文章所提到的,该内容包含许多语法和拼写错误的迹象之一。谷歌也可能使用事实检查作为低质量内容的检测工具。
策划内容
如果一个页面多的网站做了一系列有计划的链接,它实际上会被熊猫算法命中。内容计划本身还不错。为了做到这一点,整合大量数据非常重要。周到的解释和数据分析。但是,具有许多链接的页面将无法使用,具有许多链接且只有一小部分单个文本的页面也无法使用。内容规划将在“内容保留搜索引擎优化:不匹配?”中深入讨论。
切片捕获
据说这个理论是引发Panda 算法的首要原因之一,因为它曾经是链接农场中非常流行的策略。如果您想发布有关开设幼儿园课程的学校的内容,请想象标题中包含“护理学院”、“护理学院”、“护理学院”、“护理教育”等字样。事实上,这些其他文章都不需要,所以谷歌实现了熊猫算法。
从数据库生成的内容
使用数据库生成网页的做法本身并不坏,但许多公司使用数据库生成大量内容。这导致了大量低内容和低质量的页面,导致许多此类网站受到熊猫算法的影响。