[发明专利]用于对统一码字符的可变长度代码点转码的处理器、方法、系统和指令有效
申请号: | 201480029898.3 | 申请日: | 2014-06-26 |
公开(公告)号: | CN105247472B | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | S·阔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/06 | 分类号: | G06F9/06;G06F9/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 统一 码字 可变 长度 代码 点转码 处理器 方法 系统 指令 | ||
处理器包括多个紧缩数据寄存器。处理器还包括用于对紧缩的可变长度代码点长度确定指令解码的解码单元。指令指示第一源紧缩数据,该第一源紧缩数据具有各自表示字符的多个紧缩的可变长度代码点。指令还指示目的地存储位置。处理器还具有与解码单元和紧缩数据寄存器耦合的执行单元。执行单元用于:响应于指令而将结果紧缩数据存储在所指示的目的地存储位置中。结果紧缩数据将具有多个紧缩的可变长度代码点中的每一个的长度。还公开了其他处理器、方法、系统和指令。
背景
技术领域
本文中所描述的各实施例一般涉及处理器。具体而言,本文中所描述的各实施例一般涉及具有对于对统一码(Unicode)字符的可变长度代码点转码有用的指令的处理器。
背景技术
计算机根本上是处理二进制数。它们一般不处理各种不同的语言或惯例中所使用的各种不同类型的字母、十进制数、符号或其他字符。相反,由二进制数对这些不同的字母、十进制数、符号和他字符赋值,并由二进制数表示它们。
通用字符集(Universal Character Set;UCS)是若干字符编码方式所基于的标准化字符集。UCS由国际标准ISO/IEC 10646“信息技术-通用多八位组编码字符集(UCS)”以及对此标准的修订来定义。UCS包括来自世界上最流行的语言、脚本和管理的大量不同的字符,包括字母、数字、符号、表意符号、简写和其他字符。这些字符中的每一个字符都由被称为字符代码点(code point)的整数数字来标识。
伴随着UCS一起,已开发了统一码标准(Unicode)。统一码代表了用于对UCS的字符的一致的数字编码、表示和处理的计算行业标准。据报道,对于无论什么平台、无论什么程序、无论什么语言,统一码为每个字符提供唯一的数字。统一码当前由几乎所有的现代计算机使用,并充当用于在因特网上处理文本的基础。
可以通过各种不同的字符编码方式来实现统一码。一种普遍使用的编码是UTF-8(UCS转换格式-8位)。UTF-8是可以表示统一码中的每个字符的可变长度(例如,可变数量的字节)的编码方式。利用一个与四个字节之间的范围来表示每一个统一码字符。在统一码标准中也将字节称为八位组(octet)。UTF-8使用一个字节来表示ASCII字符中的任何一个。UTF-8 向后兼容于ASCII,并且字符在ASCII和UTF-8两者中具有相同的编码方式。由两个、三个或四个字节来表示其他非ASCII字符。据估计,UTF-8 是万维网中的网页中占主导的统一码编码方式,因为估计所有网页中的多于一半网页使用UTF-8来编码。UTF-8还广泛地由电子邮件程序用来显示和创建邮件。UTF-8也正越来越多地用于在某些编程语言、操作系统、应用编程接口(API)和软件应用中对统一码字符编码。
另一种普遍使用的编码方式是UTF-16(UCS转换格式-16位)。UTF-16 是可以表示统一码中的每个字符的可变长度(例如,可变数量的字节)的编码方式。每一个统一码字符都利用两个或者四个字节来表示。UTF-16不向后兼容于ASCII。在某些编程语言中(诸如例如,Java、C#以及Java脚本(JavaScript))以及在某些操作系统中,UTF-16通常被用作统一码的内部形式。还使用各种其他已知的编码方式(例如,UTF-2、UTF-32、UTF-1,等等)。
通常,为了促进计算机系统内的处理,可以将UTF-8、UTF-16或其他经编码的数据转码为另一格式,诸如例如,统一码。转码表示一种编码方式到另一种编码方式的直接数字向数字的数据转换。可以出于各种原因来进行此类转码,诸如例如,为帮助改善处理数据的效率或速度,为将经编码的数据转换为软件使用的格式或更广泛地识别的格式,等等。通常需要大量的处理来将网页内容、以标记语言格式化的文档、XML文档等从一种编码方式(例如,UTF-8)转码为标准的统一码字符或其他格式。由于此类转码的流行性和/或其对性能的潜在影响,用于转码的新的有用的方法将提供优势。
附图说明
通过参考用于说明实施例的以下描述和所附附图,可最佳地理解本发明。在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480029898.3/2.html,转载请声明来源钻瓜专利网。