为了帮助您更好地了解和更有效地与您的SEO团队沟通,我们编写了一个由3部分组成的SEO教程,其中涵盖基本SEO概念及其相关定义,在这里我只专注于那些最基本和讨论最多的术语。

第一部分:SEO页面内容概述

在我们的SEO词汇表的第一部分中,我们将讨论页面上的SEO概念和定义的基础知识。

页面文本是指网页的实际书面内容,并且应该为访问者提供有价值的信息。由于搜索引擎抓取工具渴望书面内容,因此评估网站页面的最佳实践清单应包括:

字数:虽然所有网页都没有通用的“理想”字数,但普遍接受的做法是每页至少有500个字,最好是2250字,但这会因主题和页面的用途而异。

您最重要的内容和SEO页面应该趋向于更长的阅读时间。也就是说,百度并不重视那些被认为是“瘦身”的网页,因此重要的是要让你的网页尽可能健壮,而不要用无关的文字内容来实现设定的字数。

折叠文本:由于搜索引擎抓取工具从上到下“读取”Web内容,因此最好将一些文本保留在页面顶部附近。这被称为“首屏”(想一想报纸),这意味着页面上的文字立即可以在屏幕上看到,而读者不必向下滚过一个巨大的图像或多个广告来获取实际内容。

关键词是在搜索引擎,例如:Google或百度中为您的行业纵向产品和/或服务输入查询时可能使用的字词。包含多个单词的搜索字符串是关键词短语。

将关键词集成到您的页面文本中(并且在页面的元信息中具有战略意义,如下所述)是一种基本的搜索引擎优化技术,通过提高您的网页在搜索引擎结果页面中显示的可能性(SERP)来提高您网站的搜索可见性)响应特定查询并提高这些关键词的整体搜索排名。

用于内容优化关键词策略将构建在关键词中,以便在整个页面文本中进行无缝编织,并且内容自然地流向读者。关键词填充是指目标关键词按比例出现超过文本的10%,博主建议3-5%的关键词密度。

长尾关键词:长尾查询 – 包含3个以上单词的搜索 – 提供了捕获流量的绝佳机会。长尾关键词短语在用户意图方面往往更精确,并且可以比由一个或两个词组成的通用关键词呈现更相关的结果。精心设计用于回答长尾搜索查询的网页内容可以带来更高的转化次数和更高的自然搜索流量整体份额,而不是大多数行业纵向使用的单一,极具竞争力的关键词。

重复内容:您的网站具有在其他地方复制的内容,无论是在自己的网页内还是在其他网站上。如果您发现您的网站需要包含重复内容的网页,您可以通过多种方式让搜索引擎知道要在其搜索结果中显示的首选网页(称为“规范化”)。

元信息:(也称为元数据)是搜索引擎用于确定您网站的网页内容的总体信息,以及在其搜索结果中索引单个页面时显示的内容。最关键的元数据是标题和描述:

标题或标题标签是用于表示网页主题的一句话文本行。

标题在搜索空间中进行繁重的提升,因为它们对应于搜索结果中列出的单个“可点击”的搜索结果。因此,每个人都需要仔细磨练,注意关键词,长度和独特性。优化网页标题时,应该注意:

合并一个或两个主要网页关键词,同时保持32个字符,包括空格。较长的标题可以用省略号(一系列句点标记,如……)缩短(截断)。重要的是要注意,使用大字体和大写单词可能会进一步缩短标题的长度。必须制作网页独有的标题,以避免重复的内容问题,并准确反映网页的内容。

描述是遵循搜索结果中标题的文本,传达有关网页内容的更多详细信息。描述声称搜索结果中的“不动产”,在用省略号截断之前允许多达86个字符(包括空格)。与标题一样,重要的是描述对于每个网页都是唯一的,并且准确地表示内容。描述应引人注目,以鼓励点击,因为它们为关键词优化提供了一个很好的机会(在合理范围内,避免“关键词堆砌”)和号召性用语。

优化页面内容:使用可视化层次结构构建页面内容有助于读者更轻松地浏览,搜索引擎可以“更好地理解”它。组织页面文本的基本工具是标题标记:

标题标签指示网页内容的结构,向搜索引擎和读者提供关于页面文本重要性的层次结构。

H1标签表示网页最重要的“标题”,类似于报纸的主要标题。H1标题标记将呈现网页上最大的文本,最佳做法是每页只有一个H1标记。

H1标签作为其下一个“伞形” H2标签(子标题)被放置,表明次要内容。反过来,H3标签和随附的页面内容将被放置在H2标签和内容之下。

标题标记的层次结构范围从H1到H6,H6表示网页中最不重要的内容。大多数网页内容仅调用H1到H3标题标记。请注意,保持标题标记字符数(包括空格为32)并且不要过度使用它们,因为它会破坏内容流,并且可能在视觉上压倒读者。

富媒体,即图像和视频,作为首选用户媒介和搜索可见性最佳实践正在迅速发展。由于富媒体是一种整体的Web趋势,因此在整个页面优化策略中合并图像和视频内容以补充文本是一种明智的做法。

到目前为止,搜索引擎抓取工具可能会“阅读”和“观看”富媒体内容,但它会消耗大量资源或抓取预算。

图像优化:虽然优化图像时需要考虑几个因素,但最重要的是图像标题(称为“文件名”),“alt属性”或“替代文字”(意为“描述图像的替代文字”):

文件名或分配给图像的标题应该是图像描绘的简短,独特和准确的文本行。简洁是关键,最佳做法是使用连字符( – )表示空格和全部小写字母。例如,红鞋比Red_Shoe更好。

替代文字或描述图像的书面文字提供了有关图像描绘内容的详细信息。这对于那些有视觉障碍并且使用屏幕阅读功能来解释页面上的内容的人来说非常重要。保持简洁(100个字符以内,包括空格),力求独特性和准确性。

视频优化:优化视频的最基本原则是标题,说明和标签:

您的页面视频的标题,如您的网页元标题本身,应该清晰,准确和简要地描述视频内容,以及反映网页内容和元信息中使用的相关关键字(同时避免过度使用)。

第二部分:SEO基本概念与搜索引擎指令

搜索引擎网页抓取系统 – 通常称为“机器人或蜘蛛”,例如“Googlebot”和“Baiduspider” – “抓取”Web,在搜索引擎结果页面中发现和索引单个网页。

通过使用相对简单的HTML(“超文本标记语言”)代码,SEO可以“告诉”搜索引擎机器人从搜索结果中排除哪些特定网页和页面级信息,以及如何处理Web中包含的链接页面的内容,通过指令(通常称为“标签”)。

最常见的搜索引擎链接标记的工作定义是:

索引:告诉机器人索引网页,从而将其包含在搜索结果中。但是,这不是必须指定的,因为它是默认设置。

Noindex指示机器人将网页排除在搜索结果中的索引之外。例如,如果您的站点有一个未完成的网页,您可以确保搜索引擎在用“noindex”漫游器标签准备好用户查看之前不会显示该页面。(就HTML代码而言,命令将是<meta name =“robots”content =“noindex”>)。

请注意,虽然“noindex”指令会阻止网页出现在SERP中,但在删除“noindex”标记之前,页面将继续被抓取。这意味着将遵循页面内容中的链接并且链接的目标页面被索引,除非还定义了“nofollow”指令,如下所述。

遵循指示元机器人跟随网页上包含的链接到链接各自的URL(网页地址)中指示的(目标)页面,然后它们将在SERP中索引。与“index”一样,“follow”指令默认生效。

Nofollow阻止机器人跟踪和索引原始页面内容中包含的链接的Web页面URL。

使用“noindex”指令中不完整网页的示例(上面),如果要将网页和其内容中的链接URL排除在索引之外,HTML代码将读取<meta name =“robots”内容=” NOINDEX,nofollow的”>。Baiduspider认可的更为简洁的指令“noindex,nofollow”根本就没有(在HTML中,它是<meta name =“robots”content =“none”>)。

请注意,“nofollow” 标记不允许对网页级别的所有链接进行以下/索引。这与适用于页面内容中各个链接的“nofollow” 属性不同。

Noarchive可防止机器人在搜索结果中显示网页的缓存副本。

Nosnippet阻止机器人在SERP中显示网页的元描述,以及页面的缓存副本。

链接配置文件概念:随着搜索引擎机器人通过链接抓取Web,您网站的链接配置文件在确定其搜索可见性方面起着关键作用。“健康的”链接配置文件有几个基本要素,定义如下:

入站链接:(也称为“反向链接”)是来自链接到您的其他网站的链接。

从一个网页传递到另一个网页的链接方案,绿萝算法导致了无数的处罚 – 经常对合法网站进行调整,这些网站在不知不觉中或无意中陷入链接方案中,阅读我们的指南,有效地使用反向链接内容使SEO走向成功。

出站链接:从您站点的Web页面到另一个站点的外部链接。与入站链接一样,确保该网站与百度和其他搜索引擎保持良好的信誉。

内部链接:链接网站中不同页面的链接。这些链接充当站点内的“线框”,提供内部结构,帮助用户进行导航,并为机器人提供爬网和索引。

锚文本:在链接中使用的可点击单词,无论是内部还是外部(出站),锚文本过去被搜索引擎视为一个强大的排名信号,但由于垃圾邮件发送者滥用锚文本(使用完全匹配关键词)试图操纵搜索引擎排名,百度搜索引擎缩减了分配的SEO权重。现在,发现过度使用具有完全匹配关键词的锚文本的网站可能会受到惩罚。

除了完全匹配,还有部分匹配,零匹配(通用)和品牌(与品牌名称或网站URL的链接)锚文本。

第三部分:高级的SEO定义

高级的SEO定义和网站“可抓取性”的概念,包括基本的搜索引擎指令,常见的客户端和服务器错误。

爬行:简单来说,“可抓取性”是指搜索引擎机器人(或像Baiduspider这样的“机器人”)在搜索引擎结果页面中编写索引页面时可以“抓取”网站的难易程度。

网站管理员和开发人员可以使用多种工具和最佳实践来优化搜索引擎机器人的网站 – 换句话说,最大限度地提高其可抓取性 – 以及最大限度地减少通常的抓取错误。网站可抓取性的最终目标是加快机器人抓取和索引单个页面的速度和准确性。

基本搜索引擎指令:用户代理是大量自动搜索引擎机器人(又称机器人,爬虫,蜘蛛)及其相应的Web浏览器(例如,Chrome,Internet Explorer,Firefox)的总称。

Web开发人员和SEO使用用户代理切换器,在测试网站在被不同搜索引擎机器人抓取时的呈现方式时,会更改浏览器的用户代理(例如Chrome,Internet Explorer,Firefox)。更改浏览器的用户代理是一种通常为品牌“极客小队”保留的高级方法。

搜索引擎机器人和相应浏览器的简短列表包括:

Googlebot for Chrome;

Bing的Bingbot;

适用于Yahoo!的Slurp;

MSNbot for MSN / Live;

Web开发人员还可以应用大量用户代理和切换器来查看不同浏览器在移动设备上的工作方式。Web开发人员可以选择使用自定义用户代理; 对于更大,更复杂的网站,这是一种更常见的做法。

另一组搜索引擎指令以重定向为中心,将网页URL转发到新的网页地址,将网站访问者和搜索引擎机器人指向不同的网页。通常使用两种重定向:永久(301)和临时(302)。

301表示永久重定向,反映网页的HTTP(超文本传输​​协议)状态代码(HTTP状态代码在下面进一步讨论)。它是网页重定向的推荐方法,因为它将原始页面的大部分PageRank状态传递给新页面。

302表示临时重定向,它没有传递PageRank,通常不推荐。

错误和最佳实践:有几个常见且看似持久的问题会影响网站的性能,导致用户体验不佳。更典型的问题包括Web服务器故障,错误重定向,链接断开,页面速度慢,重复内容和多个URL。

幸运的是,网站管理员和开发人员可以采取对策来解决这些问题。在这里,我们定义了最常遇到的问题和阻止它们的最佳实践。

错误是HTTP响应状态代码,范围从1xx到5xx,表示对搜索查询的五类标准化响应。

最常见的是3xx重定向(前面描述),4xx客户端(网站所有者)错误,5xx服务器错误和404无响应。

您很可能熟悉404未找到错误消息,该消息仅表示无法找到所请求的页面URL。这通常是链接断开或失效的结果。最佳做法是开发自定义404页面以向(可能是受挫的)搜索者显示,以非技术语言提供帮助或指导。

第二个常见的4xx错误是444无响应,表明服务器无法返回信息并关闭连接,这通常用于抵御恶意软件。

5xx服务器错误响应代码表示服务器知道错误,并且无法执行用户的请求。有18个5xx响应,范围从500内部服务器错误到504网关超时。

规范链接元素和规范HTTP标头:如果网页内容可以通过多个HTTP标头(URL)访问,具有在其他地方发布的联合内容,或者以其他方式重复,则建议使用规范化。规范化意味着为您的内容定义单个首选网页URL,从而整合并加强链接和排名信号,以提高搜索可见性。

有几种方法可以做到这一点,例如在HTTP标题中为可下载的白皮书和PDF 指定规范链接,所有这些都可以通过百度的网站站长帮助论坛找到。

网站速度:网站速度是百度搜索排名算法的一个主要信号,搜索巨头继续通过其移动友好计划推动更快的互联网体验,鼓励网站管理员改善页面加载时间。虽然富媒体是一种可以接受的媒介,但重要的是要注意图像的大小和视频的 “庞大” ,因为它们可能会显着减慢上传时间。

站点地图:XML Sitemaps使用XML标记在文件中列出网站的Web页面,这些标记使用“可扩展标记语言”(即XML)模式详细说明了您网站的组织。建议最佳做法是向搜索引擎提交XML站点地图,以帮助搜索引擎机器人快速准确地抓取和索引站点的页面。

我们希望本篇基础SEO教程的介绍对您有帮助!