[发明专利]用于通过网络中的字典压缩短文本的系统和方法有效
申请号: | 201280066976.8 | 申请日: | 2012-11-14 |
公开(公告)号: | CN104054316A | 公开(公告)日: | 2014-09-17 |
发明(设计)人: | A·库马尔;S·M·阿梅德;V·K·达勒布;R·乔希 | 申请(专利权)人: | 思杰系统有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08;H03M7/30;H04L12/58 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 美国佛*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 通过 网络 中的 字典 压缩 文本 系统 方法 | ||
1.一种用于压缩短文本数据的方法,所述方法包括:
由装置接收要压缩的文本,该文本包括多个符号;
由所述装置为多个符号中的每个符号识别字典,该字典包括符号列表,该符号列表按符号在距为其生成了该字典的符号的预定距离处出现的概率降序排列;以及
由所述装置采用与所述文本的第一位置相距所述预定距离的符号所对应的字典,对该第一位置中的第一符号进行编码。
2.根据权利要求1所述的方法,其中所述预定距离是紧接在为其生成了所述字典的符号之后的文本位置。
3.根据权利要求1所述的方法,还包括由所述装置生成通用字典,其中所述通用字典包括符号列表,该符号列表按符号在语言的单词开头处出现的概率降序排列。
4.根据权利要求3所述的方法,还包括由所述装置采用默认字典对与空格或者特殊字符中的一个相距所述预定距离的符号进行编码。
5.根据权利要求3所述的方法,还包括由所述装置采用通用字典对所述文本开头处的符号进行编码。
6.根据权利要求1所述的方法,还包括由所述装置采用与将要编码的符号相距所述预定距离的符号的字典,对所述文本的每个符号进行编码。
7.根据权利要求1所述的方法,其中所述符号包括字母、数字、一组符号或者特殊字符中的一个。
8.根据权利要求1所述的方法,还包括由所述装置为语言的每个字母生成单独的字典以及为数字生成数字字典。
9.根据权利要求1所述的方法,还包括由所述装置将多个字典的第一条目设置为空格。
10.根据权利要求1所述的方法,还包括由所述装置采用与所述文本的第二位置相距所述预定距离的符号所对应的字典,对该第二位置中的第二符号进行编码。
11.一种用于压缩短文本数据的装置,所述装置包括:
接收模块,其被配置为接收要压缩的文本;以及
编码模块,其被配置为:
为多个符号中的每个符号识别字典,以及
采用与所述文本的第一位置相距预定距离的符号所对应的字典,对该第一位置中的第一符号进行编码。
12.根据权利要求11所述的装置,其中所述预定距离是紧接在为其生成了所述字典的符号之后的文本位置。
13.根据权利要求11所述的装置,其中所述编码模块还被配置为生成通用字典,所述通用字典包括符号列表,该符号列表按符号在语言的单词开头处出现的概率降序排列。
14.根据权利要求13所述的装置,其中所述编码模块还被配置为采用默认字典对与空格或者特殊字符中的一个相距所述预定距离的符号进行编码。
15.根据权利要求13所述的装置,其中所述编码模块还被配置为采用通用字典对所述文本开头处的符号进行编码。
16.根据权利要求11所述的装置,其中所述编码模块还被配置为采用与将要编码的符号相距所述预定距离的符号的字典,对所述文本的每个符号进行编码。
17.根据权利要求11所述的装置,其中所述符号包括字母、数字、一组符号或者特殊字符中的一个。
18.根据权利要求11所述的装置,其中所述编码模块还被配置为为语言的每个字母生成单独的字典以及为数字生成数字字典。
19.根据权利要求11所述的装置,其中所述编码模块还被配置为将多个字典的第一条目设置为空格。
20.根据权利要求11所述的装置,其中所述编码模块还被配置为采用与所述文本的第二位置相距所述预定距离的符号所对应的字典,对该第二位置中的第二符号进行编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思杰系统有限公司,未经思杰系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280066976.8/1.html,转载请声明来源钻瓜专利网。