[发明专利]一种对词库压缩编码及解码的方法和系统无效
申请号: | 200910038254.1 | 申请日: | 2009-03-27 |
公开(公告)号: | CN101520771A | 公开(公告)日: | 2009-09-02 |
发明(设计)人: | 高精鍊;陈炳辉;刘志玭 | 申请(专利权)人: | 广东国笔科技股份有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510620广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种对词库压缩编码的方法,包括:A.统计词库中各个单词后生成第一频率表,该第一频率表包括一组首字母频率数据组以及若干组后续字母频率数据组;B.将第一频率表中的每组频率数据按照大小顺序进行排序,将每组频率数据位于相同序位的频率数据相加,得到包括若干个和频率的第二频率表;C.对和频率进行哈夫曼编码获得对应的二进制码,将获得的二进制码分配给第二频率表中每个和频率所对应的序位,生成编码表;D.根据所述编码表中首字母、每个字母的各个后续字母所在序位对应的二进制码,替换词库中单词的字母,生成单词对应的二进制编码。本发明还提供了一种对词库压缩编码的系统,以及一种对词库编码进行解码的方法和系统。本发明提高了词库中单词编码的压缩率,而且解码简单。 | ||
搜索关键词: | 一种 词库 压缩 编码 解码 方法 系统 | ||
【主权项】:
1. 一种对词库压缩编码的方法,其特征在于,包括以下步骤:A、统计词库中各个单词后生成第一频率表,该第一频率表包括一组首字母频率数据组以及若干组后续字母频率数据组,所述首字母频率数据组包括每个字母在词库单词中作为首字母的出现次数,所述后续字母频率数据组包括每个字母的各个后续字母在词库单词中的出现次数;B、将所述第一频率表中的每组频率数据按照大小顺序进行排序,再将所述第一频率表中各组位于相同序位的频率数据进行相加,得到包括若干个和频率的第二频率表;C、对所述的若干个和频率进行哈夫曼编码获得对应的若干个二进制码,将获得的二进制码分配给第二频率表中每个和频率所对应的序位,生成编码表;D、根据所述编码表中首字母、每个字母的各个后续字母所在序位对应的二进制码,替换词库中单词的字母,生成单词对应的二进制编码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东国笔科技股份有限公司,未经广东国笔科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910038254.1/,转载请声明来源钻瓜专利网。