你知道所有关于搜索引擎优化的方法,一个结构良好的网站,相关的关键词,适当的标签,算法标准和大量的内容,但是您可能不会对百度蜘蛛优化有太多想法。
百度蜘蛛优化与搜索引擎优化不同,因为它进一步深入。搜索引擎优化更侧重于优化用户查询的过程,百度蜘蛛优化专注于百度的抓取工具如何访问您的网站。
虽然有很多重叠。不过,我想做出这个重要的区分,因为它可以以不一样的方式影响您的网站,网站的可爬行性是确保其可搜索性的重要第一步。
百度蜘蛛是什么?百度蜘蛛是百度搜引擎的一个自动程序,可以抓取网页数据并创建索引数据库。蜘蛛程序会默认抓取网站的每个页面,并将其添加到可以被用户的搜索查询访问并返回的索引。
百度蜘蛛如何抓取您的网站的整个想法对理解百度蜘蛛优化至关重要:
百度蜘蛛花费更多时间来抓取具有重要网页排名的网站,百度蜘蛛为您的网站提供的时间称为“抓取预算”。页面的权限越大,它获得的抓取预算就越多。
百度蜘蛛始终抓取您的网站,百度蜘蛛平均每隔几秒就访问您的网站。换句话说,您的网站总是被抓取。在搜索引擎优化领域有很多关于“抓取频率”的讨论,以及如何让百度重新抓取您的网站以获得最佳排名。
百度蜘蛛会持续抓取您的网站,而且新鲜度,反向链接,社交链接越多,您的网站就越有可能出现在搜索结果中。重要的一点是,百度蜘蛛不会一直抓取您网站上的每个网页。新颖,一致的内容总能吸引抓取者的注意力,并提高排名靠前的页面的可能性。
百度蜘蛛首先访问网站的robots.txt,以找出抓取网站的规则,任何不被允许的页面都不会被抓取或编入索引。
百度蜘蛛使用sitemap.xml发现要抓取并编入索引的网站的所有区域,由于网站的构建和组织方式有所不同,因此抓取工具可能无法自动抓取每个网页或部分。动态内容,低排名页面或内容很少的大量内容档案可以从精确构建的站点地图中受益,站点地图也有助于向百度提供有关视频,图片,移动设备和新闻等类别背后的元数据的建议。
百度蜘蛛优化的六条原则由于百度蜘蛛优化是搜索引擎优化之前的一个步骤,因此重要的是您的网站尽可能简单准确地编入索引。
1.不要太花哨
我的建议是,“不要太花哨”, 百度蜘蛛不会抓取JavaScript,框架,DHTML,Flash和Ajax内容。
百度并未对百度蜘蛛如何分析JavaScript和Ajax提供任何意见,所以您最好不要将大部分重要的网站元素和/或内容委托给Ajax / JavaScript。
2.用你的robots.txt做正确的事情
你有没有真的想过为什么你需要一个robots.txt?这是SEO的标准最佳做法,但为什么?
为什么robots.txt是必不可少的一个原因是因为它能够对百度蜘蛛进行指示,百度蜘蛛会在您网站上的任何网页上放置抓取预算。您需要告诉百度蜘蛛应该在哪里,不应该花费抓取预算。如果您网站的任何网页或单页不应该被抓取,请相应地修改您的robots.txt文件。
百度蜘蛛花费在网站不必要的部分上的时间越少,它就越可以抓取并返回网站中更重要的部分。
百度蜘蛛的默认模式是抓取所有内容并将其编入索引,robots.txt的要点是告诉百度蜘蛛不应该去的地方,让抓取工具放在任何你想成为谷歌索引一部分的地方。
拓展阅读:robots.txt文件协议设置技巧
3.创建新鲜的内容
更频繁的抓取更有可能获得更多流量或排名,虽然页面权重可能是抓取频率的决定性因素,但与相似排名页面的新鲜度因子相比,页面权重可能不那么重要。
对于百度蜘蛛优化来说,让您排名较低的网页尽可能频繁地抓取尤其重要,如果你的权重页面比竞争对手更频繁地抓取,你就赢了。”
4.优化无限滚动页面
如果您使用无限滚动页面,那么您不一定会破坏百度蜘蛛优化的机会,但是,您需要确保您的无限滚动页面符合百度提供的规定。
5.使用内部链接
内部链接本质上是百度蜘蛛在抓取您的网站时遵循的地图,您的内部链接结构越整合和紧密,百度蜘蛛将越好地抓取您的网站。
拓展阅读:内部链接的12条建议
6.创建一个sitemap.xml
您的站点地图是百度蜘蛛关于如何访问您的网站的最清晰的消息之一。基本上,站点地图完全按照顺序进行操作 – 可作为百度蜘蛛遵循的站点地图。并非每个网站都可以轻松抓取,由于缺乏更好的词汇,复杂的因素可能会“混淆” 百度蜘蛛或在抓取您的网站时将其误用。
抓取错误
您可以了解您的网站是否遇到任何抓取状态问题,由于百度蜘蛛经常抓取网页,因此您的网站要么自行爬网而没有问题,要么会抓取错误,例如根据最后一个索引预计将存在的网页,检出抓取错误是百度蜘蛛优化的第一步。
被阻止的网址
如果你想检查你的robots.txt是否正常工作,那么“阻止的URL”会告诉你你需要知道什么。
网址参数
根据动态URL导致重复内容的数量,您可能会在URL参数索引中遇到一些问题。“网址参数”部分允许您配置百度使用网址参数对您的网站进行抓取和编入索引的方式。默认情况下,所有网页都会根据百度蜘蛛决定的方式进行抓取:
结论
如果您想真正简化并改善您网站的效果和搜索引擎优化,那么您应该为百度蜘蛛优化工作付出一些时间和精力,一些网站管理员没有意识到他们忽视的流量,仅仅是因为他们没有对百度蜘蛛优化给予适当的关注。
为了在搜索引擎结果中进行索引和返回,必须对网站进行抓爬,除非该网站被准确抓取,否则它将不会被索引或返回,从现在开始,为百度蜘蛛优化您的网站,并查看它如何更好地改变您的流量。