[发明专利]笔画数据的处理方法、装置及笔画数据的存储方法、装置无效
申请号: | 201110115929.5 | 申请日: | 2011-05-05 |
公开(公告)号: | CN102200843A | 公开(公告)日: | 2011-09-28 |
发明(设计)人: | 宁亚峰;张岩 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 笔画 数据 处理 方法 装置 存储 | ||
技术领域
本发明涉及文字输入技术领域,特别是涉及一种笔画数据的处理方法和装置,以及一种笔画数据的存储方法和装置。
背景技术
当今手机领域中,非智能机占据了80%以上的市场,其中,低端机占据了非智能机70%以上的市场。在系统资源上,不管是存储空间,还是CPU的性能,低端机都远远不如高端机;因此,需要对低端机进行存储优化,以让出更多的存储空间给其它功能模块,在低端机上实现与高端机尽量类似的功能。
目前,低端机中使用的笔画输入法,通常使用手机键盘输入键码,例如,手机键盘上的‘1’表示‘横’,‘2’表示‘竖’,‘3’表示‘撇’,‘4’表示‘点’,‘5’表示‘折’等;输入的多个键码组成键码串。
现有低端机中大多使用笔画数据表来存储汉字的笔画数据,这里的笔画数据存储通常使用4个bit(位)表示一个笔画,这样,一个byte(字节)可以表示2个笔画,其中,字节的高四位和低四位分别表示1个笔画。
应用上述存储方法,现有笔画输入方法在接收到输入的键码串后,会首先进行笔画数据匹配,所述笔画数据匹配主要可以包括:
步骤A1、从笔画数据表中取出各个汉字的笔画数据;
步骤A2、依次取出每个笔画数据byte的高4位和低4位,组合得到该汉字的笔画串值;
步骤A3、将每个汉字的笔画串值和输入的键码串进行一一比较,如全部相同,则返回全匹配,如有任一键码不同,或输入键码包含笔画串值,则返回不匹配,否则返回部分匹配。
上述存储方法对低端机的性能带来如下影响:
1、占用大的存储空间;
国标GB2312-1980的字库共收录汉字6763个,平均每个汉字的笔画数为11笔,也即,平均一个汉字占用6个byte,这样,笔画数据存储所占用的存储空间为36K;但手机中输入法能够使用的空间总共有500K左右,这不仅给输入法而且给手机中的其它功能模块增加了空间负担。
2、运算效率较低。
在进行笔画数据匹配时,需要将笔画数据解析成具体的键码值,以及,将每个汉字的键码值和输入的键码串进行一一比较;由于平均每个汉字的笔画数为11笔,这样平均每个汉字要解析11次和比较11次,才能完全确定汉字是否符合匹配条件,这无疑造成了运算效率的降低,从而影响了文字输入的速度。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够降低笔画数据所占用的存储空间,以及,提高笔画数据匹配的效率,从而提高文字输入的速度。
发明内容
本发明所要解决的技术问题是提供一种笔画数据的处理方法、装置和一种笔画数据的存储方法、装置,能够大大降低笔画数据所占用的存储空间,以及,提高笔画数据与输入笔画串的匹配效率,从而提高文字输入的速度。
为了解决上述问题,本发明公开了一种笔画数据的处理方法,包括:接收用户输入的针对一文字的笔画串;对所述笔画串每三个笔画进行一划分,形成若干划分段;如果某一划分段内的笔画数足3个,则将该划分段内的三个笔画作为一个3位的6进制数转换为一个二进制数;如果某一划分段内的笔画数不足3个,则通过上限补位和下限补位得到一个具有上下限的区间,所述区间采用补位后分别代表上限和下限的两个3位6进制数转换得到的两个二进制数表示;基于对每个划分段所做的上述处理,得到用于表征所述笔画串的至少一组二进制数,其中每一组二进制数包含若干个代表相应划分段内笔画的二进制数和/或者二进制数区间;根据上述用于表征所述笔画串的至少一组二进制数在字库中进行匹配,得到匹配结果;依据匹配结果,获取文字候选项进行展示。
优选的,所述对笔画串每三个笔画进行一划分具体包括:按照所述笔画串的原始顺序,每三个笔画进行一划分;所述得到用于表征所述笔画串的至少一组二进制数具体包括:得到用于表征所述笔画串的一组二进制数;
或者,
优选的,所述对笔画串每三个笔画进行一划分具体包括:按照所述笔画串的原始顺序每三个笔画进行一划分;以及按照所述笔画串的修正顺序每三个笔画进行一划分;所述得到用于表征所述笔画串的至少一组二进制数具体包括:得到用于表征所述笔画串的多组二进制数。
优选的,所述的方法还可以包括:所述字库中每一文字的笔画数据为一组二进制数;其中,每个二进制数是按照文字笔画顺序,将每三个笔画或者不足3笔的补0后,作为1个3位的6进制数转换得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110115929.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置