[发明专利]ARM-Linux系统中文输入法汉字库生成方法在审
申请号: | 200910309134.0 | 申请日: | 2009-10-30 |
公开(公告)号: | CN101673258A | 公开(公告)日: | 2010-03-17 |
发明(设计)人: | 殷知磊;肖跃先;宋慧;何戎辽;王小玲;刘铁华;朱辉;张婷;倪国超;王勇 | 申请(专利权)人: | 成都林海电子有限责任公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30;G06F3/023 |
代理公司: | 成都九鼎天元知识产权代理有限公司 | 代理人: | 刘明芳;熊晓果 |
地址: | 610000四川省成都市国*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | arm linux 系统 中文 输入法 汉字库 生成 方法 | ||
技术领域
本发明涉及嵌入式ARM-Linux系统开发领域,特别是L、S波段卫星移动通信便携式移动终端的ARM-Linux系统中文输入法汉字库生成方法。
背景技术
目前,ARM板已普遍应用于手机、玩具等电器产品中。特别是嵌入式Linux技术与ARM板相结合,以其开放的源代码、低廉的价格、方便的开发环境受到了众多开发厂家的青睐。然而,在ARM系统上安装的嵌入式Linux系统中,虽然支持汉字字符的显示,但并未提供任何中文汉字的输入方法,以至,用户不能通过ARM系统输入任何汉字。显然,这样的平台完全不能满足L、S波段卫星移动通信便携式移动终端,对用户信息输入的功能要求。
在一些比较成熟的嵌入式系统和PC机上,均提供一种或者多种中文输入法,以方便用户输入中文信息。但是这些系统的中文输入法程序由于不能与ARM指令系统兼容,因此不能简单复制到ARM系统中直接使用。虽然在ARM系统上开发的程序中需要使用汉字提示时,可以通过PC机上编辑这些汉字,然后通过交叉编译器生成可执行程序文件后,拷贝至ARM系统。当程序在ARM平台上运行后,屏幕上就可以显示出这些汉字提示,但要在程序中直接输入汉字数据则无能为力了。显然,这种情况极大地限制了ARM系统在实际中的应用。
设计ARM系统上的中文输入法过程中,中文汉字库是中文输入法实现的基础,中文汉字库的设计关系到整个中文输入法的性能。优秀的中文汉字库应该在保证中文输入法正确的前提下,使中文输入法的设计与实现更加简单和高效。
在需要自己设计输入法的系统中,比如L、S波段卫星移动通信便携式移动终端使用的嵌入式Linux系统中,目前没有成熟的用于汉字输入的中文汉字库。
发明内容
本发明的目的是克服现有技术的缺陷,提供一种主要服务于L、S波段卫星移动通信便携式移动终端系统中的中文输入法支持的汉字库生成方法。
本发明的目的是这样实现的:
ARM-Linux系统中文输入法汉字库生成方法,本方法的ARM-Linux系统中文输入法汉字库通过以下五个步骤生成:
1、在Windows系统PC机中运行汉字采集模块:汉字采集模块将按照内置的拼音组合规则,自动产生各种汉语拼音组合,并将组成这些拼音组合的字母自动发送到PC机系统的中文全拼输入法模块,用汉字采集模块模拟键盘按键信息输入,汉字采集模块在运行期间将把拼音信息和捕获的PC机系统中文全拼输入法输出的对应汉字编码信息一起保存在一个汉字采集文件中,直到将所有的汉语拼音信息和汉字信息记录完成,汉字采集模块将自动结束运行。
2、按照既定的汉字库格式初始化汉字库:以上述步骤1所得到的汉字采集文件为输入,按照ARM-Linux系统准备开发的中文全拼输入法的功能要求确定编码组织形式,对初始化汉字库进行填充,生成初级汉字库。
3、确定ARM-Linux中无法正常显示的汉字:将生成的初级汉字库通过网络传输到ARM-Linux系统中,然后,在ARM-Linux系统中,按照输入法可以访问的形式,将汉字库中的拼音和对应汉字自动遍历并在ARM-Linux系统显示出来,ARM-Linux中无法正常显示的汉字的十六进制编码为“EF BF BD”,将包括该编码信息的拼音和汉字信息保存成为一个新的文档;由于ARM-Linux中对任何无法正常显示的汉字编码都将统一用十六进制的“EF BF BD”表达,而能够正常显示的汉字编码则直接使用其对应的唯一一个UTF8编码表达,因此我们通过捕获显示汉字的编码,就可以非常容易地确定哪些汉字在ARM-Linux中不能正常显示。
4、剔除无法正常显示的汉字:将步骤3所得到的记录有ARM-Linux中无法正常显示的汉字文档信息通过网络传输回PC机系统,以ARM-Linux中无法正常显示的汉字文档信息为输入,遍历初级汉字库,将ARM-Linux中无法正常显示的汉字文档中的汉字剔除,同时重新生成一个全部由ARM-Linux中可以正常显示的汉字组成,符合步骤1所产生的文件格式的新文件,以便在下一步生成一个ARM-Linux环境中可用的汉字库。
5、按照既定的汉字库格式生成最终汉字库:以已剔除全部无法显示汉字的文件为输入,按照ARM-Linux系统准备开发的中文全拼输入法的功能要求确定编码组织形式,生成最终可以在ARM-Linux系统中正常使用的汉字库,这样全拼输入法使用的汉字库生成完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都林海电子有限责任公司,未经成都林海电子有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910309134.0/2.html,转载请声明来源钻瓜专利网。