超文本标记语言(HyperText Markup Language, HTML)是一种计算机语言,用于创建可以在Internet上发布或通过电子邮件发送的页面。

尽管对许多人来说它可能看起来很复杂,但它被认为是一种相对简单的语言。用这种语言设计的页面的所有文本、图形和设计元素都被“标记”了代码,这些代码指示web浏览器或电子邮件程序如何显示这些元素。

标签还提供布局和格式信息,以便网页或电子邮件看起来尽可能接近其设计者所希望的样子。对于网站设计新手或任何需要了解特定代码或想要学习如何创建整个网站的人来说,有许多软件工具、程序和网站可以帮助他们编写HTML代码。

HTML的结构

HTML编码的结构类似于一棵树,其中嵌套了每个不同的标记。在大多数情况下,每个格式化元素都需要一个开始标记和一个结束标记,不同的标记不应该重叠。

这就是“嵌套”的含义,如果标记2在标记1之后打开,那么标记2应该首先关闭,以便标记2的格式化元素完全包含在标记1中。元素是组成代码的各个组件,包括开始和结束标记以及它们之间的内容。属性提供关于元素的更多信息,由属性及其值组成,通过等号连接。

要创建一个HTML元素,用户需要创建一个以尖括号开始和结束的标记,并将其放在需要格式化的文本之前。尖括号内的代码(通常是一个或多个字母、数字、单词和/或符号)指示元素是什么以及内容应该具有的属性,如大小、字体或其他特征。

为了结束格式化,用户键入第一个尖括号,然后是一个反斜杠,然后重复元素代码并关闭括号。例如,<title><strong>HTML是什么?</span><span data-section=”6″ data-sentence=”4″></strong></title>是用于格式化本文标题的代码,“strong”元素标签嵌套在“title”标签内。

HTML类型的代码

有许多代码允许不同的文本格式,包括斜体、表格、段落和到web页面的超链接。代码还可以指示浏览器或电子邮件程序如何显示或使用其他元素,如图片、图形、视频和声音。

没有尖括号的其他类型的代码可用于创建标点符号、变音符号和文本中可能出现的其他符号。虽然所有的web浏览器和许多电子邮件程序都使用HTML,但每个浏览器和电子邮件程序对代码的解释和显示可能略有不同,设计人员在创建web页面时通常必须考虑这些变化。

一门不断发展的语言

自从英国计算机科学家Tim Berners-Lee在20世纪90年代早期开发HTML以来,出现了许多变化和版本。这些版本自1996年以来一直由万维网联盟(W3C)维护。

2008年1月,开发该规范的工作组发布了HTML 5的第一个公开工作草案。截至2011年,该版本仍在开发中,预计将极大地改变web应用程序的开发。它引入了许多新元素,包括站点结构、交互性、音频和视频支持,以及新的属性。

如何查看Web页面的代码?

用于创建任何web页面的代码都可以通过在浏览器中导航到该页面,然后从浏览器菜单中选择正确的选项来查看。在大多数浏览器中,用户可以点击“查看”菜单,选择“源”、“查看源源代码”或“查看页面源代码”等选项。这将导致弹出窗口出现,并显示用于创建该web页面的代码。

需要注意的是,并非所有web页面上的所有内容都是用HTML编写的。可扩展标记语言(XML)和可扩展超文本标记语言(XHTML)是web开发中使用的其他标记语言类型。

此外,样式表—如层叠样式表(CSS)—用于将样式附加到HTML文档。Flash®和Java®等语言用于创建交互式内容,还有许多其他的编程语言可以用来为网站添加特定的功能。

HTM与HTM相比

实际上,HTM和HTML扩展之间几乎没有区别,因为大多数机器都将它们作为HTML文件读取。有两个不同的扩展开始的原因是,某些类型的计算机,如那些运行在16位DOS或Windows®3系统,不能读四个字符扩展,因此需要三个字符的HTM扩展。

大多数可以读取四个字符扩展名的系统都被自动编程以将HTM文件识别为HTML文件,尽管计算机用户有时可能需要一个转换器将HTM文件转换成系统可以识别的格式。