HTML5 - 字符编码

字符编码是一种将字节转换为字符的方法.要验证或显示HTML文档,程序必须选择字符编码. HTML 5作者有三种设置字符编码的方法;

HTTP内容类型标题

如果您正在编写cgi或类似程序,那么你将使用HTTP Content-Type 标头来设置任何字符编码.

以下是简单示例 :

print "Content-Type: text/html; charset=utf-8\r\n";

<meta>元素

您可以使用< meta>具有charset属性的元素,该属性指定HTML5文档的前512个字节内的编码.

以下是简化示例 :

<meta charset="UTF-8">

上面的语法取代了对<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">的需求;虽然仍然允许该语法.

Unicode字节顺序标记(BOM)

字节顺序标记(BOM)由字符代码U +组成FEFF在数据流的开头,它可以用作定义字节顺序和编码形式的签名,主要是未标记的明文文件.

许多Windows程序(包括Windows记事本)在保存为UTF-8的任何文档的开头添加字节0xEF,0xBB,0xBF.这是Unicode字节顺序标记(BOM)的UTF-8编码,通常称为UTF-8 BOM,即使它与字节顺序无关.

For HTML5文档,您可以在文件的开头使用Unicode字节顺序标记(BOM)字符.此字符为使用的编码提供签名.

本文链接:https://www.f2er.com/3188884.html