[发明专利]泛字符编解码方法及系统在审

专利信息
申请号: 202010143092.4 申请日: 2020-03-05
公开(公告)号: CN111368509A 公开(公告)日: 2020-07-03
发明(设计)人: 薛昌熵 申请(专利权)人: 薛昌熵
主分类号: G06F40/126 分类号: G06F40/126
代理公司: 暂无信息 代理人: 暂无信息
地址: 726412 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字符 解码 方法 系统
【权利要求书】:

1.一种泛文本字符编码算法,其特征包括:对待编码字符码点逐个读出其编码的区号、语号、字号;由区号、语号、字号共同组合成编码码元;码元变长,码元仅末尾字节首位为0,非末尾字节首位为1,依此自同步,长度无限制;将码元拼接为编码序列。

2.根据权利1,其特征在于:根据码元长度与编字数量和内容,将编码区分为单字节、双字节、三字节、四节三字、四节双字、四节二进制等几种结构,每个结构对应一个区号,每个码元由区号、字号、一个或多个字号存储一个或多个字符,按照各自区的方法如下编码:单字节区每个码元只有一个字节长,与ASCII一一对应;双字节区码元有两个字节,存储一个字符,存储常用混排字符;三字节区码元有三个字节,存储一个字符,存储罕用字符;四节三字区码元有四个字节,存储三个字符,共用区号、语号,可容纳1~3个字号,每字号8位,用以存储常用独排字符,实现压缩存储;四节双字区码元有四个字节,存储两个字符,共用区号、语号,可容纳1~2个字号,每字号8位,用以存储次常用字母,实现压缩存储;四字节二进制区码元有四个字节,存储24位二进制,用以存储二进制、新语言、自定义等内容。

3.一种泛文本字符解码方法,其特征包括:将编码序列通过以首位为0得字节作为码元末尾字节,分割码元;根据码元长度、前缀、偏移量读出区号、语号、字号;根据区号、语号、字号组成码点,获得原始字符。

4.根据权利3,其特征包括,码元中的区号、语号、字号按照码元长度和结构不同方式解码:码元长度为一字节属于单字节区,直接映射为ASCII;码元长度为双字节属于双字节区,与常用字符一一对应;码元长度为四字节,根据前缀码识别区号;若前缀码识别为四节三字区,顺序读出语号、三个字号,组成1~3个四节三字区的字符;若前缀码识别为四节双字区,顺序读出语号、两个字号,组成1~2个四节双字区的字符;若前缀码识别为四节二进制区,读出24位二进制区,输出三个二进制字节。

5.一种泛文本字符编码系统,其特征包括:分解模块,使用分解器将待编码的泛文本字符拆分为区号、语号、字号;合成模块,将区号、语号、字号合称为码元,若前后两个码元中区号、语号相同而字号仍用空位,可以将字号填入上一个码元的字符空位以压缩存储,具体包括单字节合成器、双字节合成器、三字节合成器、四节三字合成器、四节双字合成器、四节二进制合成器。

6.一种泛文本字符解码系统,其特征包括:分解模块,包括分割器和分解器;分割器将序列码根据末尾字节首位0分割为码元;分解器据码元长度和结构依次读出区号、语号、字号;合成模块,将区号、语号、字号合称为字符码点或二进制,若字符有多个,则共用区号、语号,合成为多个字符,具体包括:单字节合成器、双字节合成器、三字节合成器、四节三字合成器、四节双字合成器、四节二进制合成器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于薛昌熵,未经薛昌熵许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010143092.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top