非常教程

HTML 字符集教程

HTML UTF-8 参考手册

HTML UTF-8 参考手册

HTML Unicode(UTF-8) 参考手册


Unicode 联盟(Unicode Consortium)

Unicode 联盟(Unicode Consortium)开发了 Unicode 标准(Unicode Standard)。他们的目标是使用标准的 Unicode 转换格式(即 UTF,全称 Unicode Transformation Format)取代现有的字符集。

Unicode 标准是一个成功的创举,在 HTML、XML、Java、JavaScript、E-mail、ASP、PHP 中都得到实现。Unicode 标准也得到许多操作系统和所有现代浏览器的支持。

Unicode 联盟与领先的标准开发组织合作,这些组织有 ISO、W3C 和 ECMA。


Unicode 字符集

Unicode 可以由不同的字符集实现。最常用的编码是 UTF-8 和 UTF-16:

字符集 描述
UTF-8 UTF8 中的字符可以是 1 到 4 字节长。UTF-8 可以代表 Unicode 标准中的任何字符。UTF-8 向后兼容 ASCII。UTF-8 是电子邮件和网页的首选编码。
UTF-16 16 位 Unicode 转换格式是一种可变长度的 Unicode 字符编码,能够编码整个 Unicode 指令表。UTF-16 主要用于操作系统和环境,如 Microsoft Windows、Java 和 .NET。

提示:Unicode 的前 128 个字符(与 ASCII 一一对应)使用一个与 ASCII二进制值相同的八位组进行编码,使有效的 ASCII 文本在进行 UTF-8 编码时也是有效的。

提示:所有的 HTML 4 处理器支持 UTF-8,所有的 HTML 5 和 XML 处理器支持 UTF-8 和 UTF-16!


HTML5 标准:Unicode UTF-8

因为 ISO-8859 中字符集大小是有限的,且在多语言环境中不兼容,所以 Unicode 联盟开发了 Unicode 标准。

Unicode 标准覆盖了(几乎)所有的字符、标点符号和符号。

Unicode 使文本的处理、存储和运输,独立于平台和语言。

HTML-5 中默认的字符编码是 UTF-8。

下面列出了一些 HTML5 支持的 UTF-8 字符集:

字符集 十进制 十六进制
C0 控制与基本的 Latin(C0 Controls and Basic Latin) 0-127 0000-007F
C1 控制与 Latin-1 的补充(C1 Controls and Latin-1 Supplement) 128-255 0080-00FF
Latin 扩展 A(Latin Extended-A) 256-383 0100-017F
Latin 扩展 B(Latin Extended-B) 384-591 0180-024F

如果 HTML5 网页使用不同于 UTF-8 的字符,则需要在 <meta> 标签中指定,如下:

实例

<meta charset="ISO-8859-1">


HTML UTF-8 参考手册
HTML 字符集

要正确显示HTML页面,浏览器必须知道页面使用的字符集(字符编码)是什么。

HTML 字符集目录

1.HTML ANSI 参考手册
2.HTML ASCII 参考手册
3.HTML 字符集
4.UTF-8 Latin(拉丁字母)扩展 A
5.UTF-8 C1 控制与 Latin1 补充
6.UTF-8 C0 控制与基本的 Latin(拉丁字母)
7.HTML 符号实体参考手册
8.HTML UTF-8 参考手册
9.HTML ISO-8859-1 参考手册
10.UTF-8 数学运算符
11.UTF-8 箭头
12.UTF-8 字母式符号
13.UTF-8 货币符号
14.UTF-8 常用标点符号
15.UTF-8 Cyrillic(西里尔字母) 补充
16.UTF-8 Cyrillic(西里尔字母)
17.UTF-8 Greek(希腊字母)与 Coptic(科普特字母)
18.UTF-8 变音符号
19.UTF-8 Latin(拉丁字母)扩展 B
20.HTML5 实体名称(字母 – D)
21.HTML5 实体名称(字母 – C)
22.HTML5 实体名称(字母 – B)
23.HTML5 实体名称(字母 – A)
24.HTML 4 实体名称
25.UTF-8 印刷符号
26.UTF-8 杂项符号
27.UTF-8 几何图形
28.UTF-8 方块元素
29.UTF-8 制表符
30.HTML5 实体名称(字母 – N)
31.HTML5 实体名称(字母 – M)
32.HTML5 实体名称(字母 – L)
33.HTML5 实体名称(字母 – K)
34.HTML5 实体名称(字母 – J)
35.HTML5 实体名称(字母 – I)
36.HTML5 实体名称(字母 – H)
37.HTML5 实体名称(字母 – G)
38.HTML5 实体名称(字母 – F)
39.HTML5 实体名称(字母 – E)
40.HTML5 实体名称(字母 – X)
41.HTML5 实体名称(字母 – W)
42.HTML5 实体名称(字母 – V)
43.HTML5 实体名称(字母 – U)
44.HTML5 实体名称(字母 – T)
45.HTML5 实体名称(字母 – S)
46.HTML5 实体名称(字母 – R)
47.HTML5 实体名称(字母 – Q)
48.HTML5 实体名称(字母 – P)
49.HTML5 实体名称(字母 – O)
50.HTML5 实体名称(字母 – Z)
51.HTML5 实体名称(字母 – Y)