重复页面是影响seo优化效果的一个因素,人们可以轻易区分两个相似内容的不同页面,而计算机的人工智能却无法以同样的方式区分。
这就是为什么搜索引擎中的爬虫程序不能检测到两个相似的产品页面是不同的,并且经常将它们标识为重复的内容,当用户从同一个网站获得多个搜索查询结果时,他们也会感到困惑。
此外,搜索引擎不知道哪个页面是最相关的,导致一个混乱的搜索排名,这就是所谓的关键词内部竞争。
出现的原因
1.具有类似清单的商业站点
2.电子商务产品页面,其中的产品非常相似,描述和功能在大多数情况下匹配。
3.除了一些重要的信息,如联系方式,价格等,大部分功能是相同的。
4.旅游网站具有相同的目的地,类似的景点,功能和细节,但具有不同的价格。
百度可能拥有专门用于检测重复页面和内容的特定算法,这不得而知。如果百度的搜索算法不能将内容标识为惟一的,那么您需要创建一个策略,以辅助百度搜索算法将其区分。
当相似性太高时
被质疑的页面可能有太多的相似之处,或者在某些地方非常相似,这些地方的相似度最高可达20%。在这种情况下,可以采取下列措施:
如果相似度在20%以内,则可以相应地发出信号,以便搜索引擎对它们进行不同的处理。这可以通过为每个页面使用不同的锚文本来实现,此外,页面可以相互链接,以清楚地表明它们是不同的。
有时,必须在某些地方稍微更改一个页面的内容,以便将它们区分为两个不同的页面,这也可以避免混淆。
使页面独一无二
如果具有太多的相似性,百度搜索引擎有时无法检测到两个页面是不同的。在这种情况下,需要在页面或其中任何一个页面上进行一些重大更改,如下:
1.可以将更多文本添加到页面或两者中。
2.如果有图像,则可以添加或编辑描述。
3.可以添加关于内容主题的相关和附加信息。
4.可以使用更多图像。
5.可以减少页面之间的公共源代码。
6.可以减少页面的语义密度。
7.如果页面中有填充符,则可以将其缩小并替换为更多事实和合理的词汇。
使用参考页面来排名,而不是单独的页面
此策略涉及在百度中使用所有重要的关键词对此类参考页面进行排名,然后将该用户引导至各个页面。在这种情况下,您无需单独对具有内容问题的页面进行排名,也可以删除其锚文本。
您所要做的就是专注于一个页面并进行排名,这可能会导致所有产品页面或不同页面。这有助于对它们进行更好的排名,并且还引起了该参考页面的关注,然后该页面可以将流量引导到用户所需的页面。
这是一种非常明智的方法,只需要使用所有必需的关键词或锚文本对一个页面进行排名和优化。并尝试使用在此页面上看起来不同的各种锚文本,并将它们与所有这些页面相关联。
检测重复页面完全是在内容审核时完成的工作,只有在检测到问题时才能找到解决方案。