您现在的位置: 圆点视线 >> 教程 >> 网页设计 >> html教程 >> 文章正文
[图文]在XHTML和HTML中使用语言信息           ★★★
在XHTML和HTML中使用语言信息
作者:佚名  文章来源:网页教学网  点击数:  更新时间:2007-10-26 17:48:28 
 页面功能:【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口 【字体:

 

主subtag代表一种语言(有两种例外,i-和x-,在下面会讨论),任意尾随的subtag服务于修饰该语言的方言或用法。后面的subtag一般代表国家,方言或文字体系。

下面的例子表明了该文档不仅使用英语而且还是英式英语,就是说,跟美式英语相对的英语写成的。

subtag对大小写是敏感的,包括从A到Z,a到z,0到9的字母和数字,而且不能多于8个字符。

需要注意的是HTML规范仍然推荐使用RFC 1766来确定语言。RFC 3066是RFC 1766的升级并且大大超越,而在HTML规范中有一个计划勘错表,因此你应该使用RFC 3066不管HTML规范的现阶段如何解说。
主subtag

所有的初始subtag必须是1,2或者3个字母的长度。所有2和3字母的subtag都是定义代码来代表语言的ISO 639 part 2中的语言代码。1个字母的subtag是一个i-或x-前缀,稍后我们会描述。

尽管代码是大小写敏感,它们经常小写,但这仅仅是一个惯例而已。

又注意,ISO提供2字母和3字母代码的选择时,你应该选择2字母的。这就确保了为每一种语言尽快地使用一个独一无二的代码,稍过时的使用2字母代码(基于 RFC 1766,不允许3字母长度的代码)数据也就不用更改了。同时,哪些3字母代码应避免的问题不是问题,因为所有的有两种不同的3字母代码的少数语言同时也会有2字母代码。

附subtag

增加附subtag可以表示地理区域,方言,文字体系,或者其他对主要(语言)subtag的改进。主subtag可以尾随任意数目的subtag,尽管多于一个的并不常见。

RFC 3066指出,任何位于次位置的2字母subtag都是ISO 3166国家代码。在任何第三位置或接下来的位置使用subtag都没有规则。

2字母的用以表示国家的ISO代码通常大写,但这也仅仅是一个惯例。
特殊的主subtag

RFC 3066定义了一些在可能不会从ISO语言代码开始的例子。

以i-开始的语言标签是为IANA注册语言标签(IANA-registered language tags)保留的。举些例子:

* i-mingo
* i-klingon
* i-tao

以x-开始的语言标签为用户自定义语言标签提供了构件。次位置上的标签必须多于一个字母,并且不能为以下的保留subtag:AA, QM-QZ, XA-XZ, and ZZ。

当然,在基于2字母或3字母的ISO代码可用的时候,这些识别语言的方法都不需要使用。这些方法用于限制或者防止可互用语言的混淆。

IANA注册语言标签

可以通过在RFC 3066提到的email提交程序来注册IANA语言标签。这些标签可以有3到8字母长的次位置代码。

注册IANA代码比使用用户自定义代码好,因为它最小化了混淆的可能性,因为IANA代码对其他人是显性的。另一方面,IANA标签是ISO标准声明不赞成的新代码。声明不赞成的IANA标签包括no-bok(挪威“Book语言”——使用ISO 639的nb),i-navajo(Navajo——使用ISO 639的lb),i-lux((Luxembourgish——使用ISO 639的lb),还有其他更多的。基于此理由,IANA注册代码应该只临时出现,用以填补ISO代码的空缺。

尽管i-前缀为IANA代码所保留,但不是所有的IANA代码都是从它开始的。比如,有很多中文方言已经注册了IANA代码,包括zh-guoyu(国语,呵呵,为什么不是普通话putonghua?),zh-hakka(客家),zh-min(闽),zh-min-nan(闽南),zh-wuu(吴)等等。

同时,业已注册的IANA代码允许你指定繁体或简体中文。过去这必须为简体中文使用zh-CN(中国大陆)和为繁体中文使用zh-TW(中国台湾)。但你不能保证其他人认知甚至遵循这个惯例。比如,有人使用zh-HK来表示繁体中文。现在IANA使用了zh-Hans和zh-Hant代码分别指定简体中文和繁体中文。下面两段举例说明了这两个代码的使用:

当世界需要沟通时,请用Unicode!

當世界需要溝通時,請用統一碼(Unicode)

语言标签的其他要点

尽管大部分时候RFC3066语言标签运作良好,但仍然有以下一些问题:

* 需要比ISO所提供的更多的代码来转换世界上接近6000中的语言尚未覆盖需要表达通用区域的代码,比如,现在仍然没有为许多组织用以创建西班牙语内容的泛拉美西班牙语代码。
* 尚未覆盖需要表达通用区域的代码,比如,现在仍然没有为许多组织用以创建西班牙语内容的泛拉美西班牙语代码。
* 现在仍然缺乏语言标签值与locale的清晰性。locale是语言加上地理区域的组合,在软件中通常用来设置日期与时间之类的事情。
* 有时候确实需要区分使用附属于该语言的文字体系。比如,蒙古人可能写蒙语或斯拉夫语,克罗地亚也可能写拉丁语或者斯拉夫语……

现在来自ISO TC37,SIL和W3C的工作人员都在为这些问题的解决方案努力着。

同时,你应该始终记住,你可以在IANA注册你所需要的语言标签。

上一页  [1] [2] 

 【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 文章录入:Rainsion    责任编辑:Rainsion  【字体:
 
  • 上一篇文章:

  •  
  • 下一篇文章:
  • 最新文章
    相关文章
    HTML元素语义的分类
    根据网页结构选择最合适的XHTML标签
    学习网页制作了解一些相关的语言代码知识
    XHTML代码头部Doctype文档类型声明必不可少
    学习网页设计时要注意HTML向XHTML转化
    网页标题和网页Meta的一些写法和注意
    网页的新颖效果 斜着滚动的marquee
    对话框插件thickbox使用技巧
    XHTML+CSS的目的和好处(WEB标准的目的和好处
    XHTML编写网页代码的七条基本规范
    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    发表评论:
     姓  名: 评 分: 1分 2分 3分 4分 5分
     评论内容: ·严禁发表危害国家安全、政治、黄色淫秽等内容的评论。
    ·用户需对自己在使用本网服务过程中的行为承担法律责任
    ·本站管理员有权保留或删除评论内容。
    ·评论内容只代表机友个人观点,与本网站立场无关。
     
    最 新 推 荐
     
    百度主题推广
    最 新 热 门