[发明专利]泛字符编解码方法及系统在审
申请号: | 202010143092.4 | 申请日: | 2020-03-05 |
公开(公告)号: | CN111368509A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 薛昌熵 | 申请(专利权)人: | 薛昌熵 |
主分类号: | G06F40/126 | 分类号: | G06F40/126 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 726412 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 解码 方法 系统 | ||
1.一种泛文本字符编码算法,其特征包括:对待编码字符码点逐个读出其编码的区号、语号、字号;由区号、语号、字号共同组合成编码码元;码元变长,码元仅末尾字节首位为0,非末尾字节首位为1,依此自同步,长度无限制;将码元拼接为编码序列。
2.根据权利1,其特征在于:根据码元长度与编字数量和内容,将编码区分为单字节、双字节、三字节、四节三字、四节双字、四节二进制等几种结构,每个结构对应一个区号,每个码元由区号、字号、一个或多个字号存储一个或多个字符,按照各自区的方法如下编码:单字节区每个码元只有一个字节长,与ASCII一一对应;双字节区码元有两个字节,存储一个字符,存储常用混排字符;三字节区码元有三个字节,存储一个字符,存储罕用字符;四节三字区码元有四个字节,存储三个字符,共用区号、语号,可容纳1~3个字号,每字号8位,用以存储常用独排字符,实现压缩存储;四节双字区码元有四个字节,存储两个字符,共用区号、语号,可容纳1~2个字号,每字号8位,用以存储次常用字母,实现压缩存储;四字节二进制区码元有四个字节,存储24位二进制,用以存储二进制、新语言、自定义等内容。
3.一种泛文本字符解码方法,其特征包括:将编码序列通过以首位为0得字节作为码元末尾字节,分割码元;根据码元长度、前缀、偏移量读出区号、语号、字号;根据区号、语号、字号组成码点,获得原始字符。
4.根据权利3,其特征包括,码元中的区号、语号、字号按照码元长度和结构不同方式解码:码元长度为一字节属于单字节区,直接映射为ASCII;码元长度为双字节属于双字节区,与常用字符一一对应;码元长度为四字节,根据前缀码识别区号;若前缀码识别为四节三字区,顺序读出语号、三个字号,组成1~3个四节三字区的字符;若前缀码识别为四节双字区,顺序读出语号、两个字号,组成1~2个四节双字区的字符;若前缀码识别为四节二进制区,读出24位二进制区,输出三个二进制字节。
5.一种泛文本字符编码系统,其特征包括:分解模块,使用分解器将待编码的泛文本字符拆分为区号、语号、字号;合成模块,将区号、语号、字号合称为码元,若前后两个码元中区号、语号相同而字号仍用空位,可以将字号填入上一个码元的字符空位以压缩存储,具体包括单字节合成器、双字节合成器、三字节合成器、四节三字合成器、四节双字合成器、四节二进制合成器。
6.一种泛文本字符解码系统,其特征包括:分解模块,包括分割器和分解器;分割器将序列码根据末尾字节首位0分割为码元;分解器据码元长度和结构依次读出区号、语号、字号;合成模块,将区号、语号、字号合称为字符码点或二进制,若字符有多个,则共用区号、语号,合成为多个字符,具体包括:单字节合成器、双字节合成器、三字节合成器、四节三字合成器、四节双字合成器、四节二进制合成器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于薛昌熵,未经薛昌熵许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010143092.4/1.html,转载请声明来源钻瓜专利网。