[发明专利]词汇自适应中文输入方法无效
申请号: | 201010551084.X | 申请日: | 2010-11-19 |
公开(公告)号: | CN101995963A | 公开(公告)日: | 2011-03-30 |
发明(设计)人: | 王晓龙;刘秉权;汤步洲;单丽莉;孙承杰;刘铭;陈清财;王轩 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 牟永林 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词汇 自适应 中文 输入 方法 | ||
技术领域
本发明涉及一种计算机、手机、或者掌上电子产品等的词汇自适应的中文输入方法。
背景技术
随着网络技术的持续发展,汉语词汇量不断增加,数以十万、百万计的词汇充斥着人们的日常生活。中文输入法对海量网络词库支持的需求越来越强烈。实际上,对于一般的用户来讲,可能使用的词汇保持在几万词左右。其他多余的词汇一方面会给输入法系统带来额外的背景噪音,会降低音字转换准确率,增加用户的使用负担;另一方面会增加操作系统存储空间的开销。如何根据给定的海量网络词库和用户的使用习惯,自动地为用户定制私有词库是现有支持海量网络词库的输入法需要解决的关键问题之一。目前,中文输入法中对词库的管理,特别是对领域专业词库的添加和删除,均是通过用户手动操作来完成的。这种模式对用户提出了以下两点要求:一、用户需要对自身所属的专业领域有准确的定位,才能对词库进行管理。二、随着时间的推移,用户所涉及的领域也是逐渐变化的,用户需要及时认清领域变化并手动作出调整。这样会大大增加用户的使用负担,在实际应用中亦难以实现。
发明内容
本发明的目的是提供一种词汇自适应中文输入方法,以降低输入法的背景噪音,减少系统开销,实现个性化输入。它基于位于服务器端的领域专业词库集、位于本地的通用词库、已经加载到本地的领域专业词库集和输入法管理系统实现,它包括下述步骤:一、从键盘输入汉语拼音字符串;二、由输入法管理系统对输入的字符串进行音节切分,形成多个音节单元,每个音节单元对应汉语中的一个或多个拼音;三、根据位于本地通用词库中词的状态和已加载到本地的领域专业词库的状态,进行音节串到汉字字符串的转换,并依次为每个音节子串提供候选;四、根据候选提示依次选择汉字词并最终输出汉字字符串;五、根据步骤四选择确定的输入汉语语句搜索位于服务端的领域专业词库集,判断已输入汉语语句中是否包含位于服务器端的领域专业词库集中的词汇;如果不存在则执行步骤六;如果存在这样的词汇,将包含该词汇的领域专业词库加载到本地,然后执行步骤六;六、根据步骤四中选择确定的输入汉语语句和步骤三中出现在候选列表中的词进行词汇状态调整,所述候选列表中的词包括位于本地的通用词库中的词和已经加载到本地的领域专业词库中的词。
由于本发明输入法在进行拼音串到汉字串的转换过程中,常态下只选择位于本地的通用词库中处于“激活”状态的词和已经加载到本地的处于“激活”状态的领域专业词库中的词,降低输入法的背景噪音,减少系统开销。根据用户输入历史信息对位于服务器端的领域专业词库进行选择性加载,对位于本地的通用词库中的词和已经加载到本地的领域专业词库进行自动“激活”与“隐藏”,实现个性化输入。
本发明为支持海量网络词汇的输入法提供词库分级检索方式实现词汇自动适应,将词库分成通用词库和领域专业词库,对于通用词库中的每一个词和各个领域专业词库设置两种状:“激活”和“隐藏”,根据用户的历史输入信息自动选择用户常用词汇领域词库,降低输入法的背景噪音,减少系统开销,实现个性化输入。
附图说明
图1是本发明的流程示意图。
具体实施方式
具体实施方式一:下面结合图1具体说明本实施方式。本实施方式基于位于服务器端的领域专业词库集、位于本地的通用词库、已经加载到本地的领域专业词库集和输入法管理系统实现,它包括下述步骤:一、从键盘输入汉语拼音字符串;二、由输入法管理系统对输入的字符串进行音节切分,形成多个音节单元,每个音节单元对应汉语中的一个或多个拼音(包括全拼和简拼);三、根据位于本地通用词库中词的状态和已加载到本地的领域专业词库的状态,进行音节串到汉字字符串的转换,并依次为每个音节子串提供候选;转换过程中,每个音节单元所对应的候选汉字以及与其后面的音节单元所组成的候选汉词依次出现在候选列表中,常态下所述候选列表中的候选汉词选自位于本地的通用词库中处于“激活”状态的汉词和已经加载到本地的领域专业词库中处于“激活”状态的汉词,非常态下所述候选列表中的候选汉词选自位于本地的通用词库中处于“隐蔽”状态的汉词和已经加载到本地的领域专业词库中处于“隐蔽”状态的汉词;四、根据候选提示依次选择汉字词并最终输出汉字字符串;五、根据步骤四选择确定的输入汉语语句搜索位于服务端的领域专业词库集,判断已输入汉语语句中是否包含位于服务器端的领域专业词库集中的词汇;如果不存在则执行步骤六;如果存在这样的词汇,将包含该词汇的领域专业词库加载到本地,然后执行步骤六;六、根据步骤四中选择确定的输入汉语语句和步骤三中出现在候选列表中的词进行词汇状态调整,所述候选列表中的词包括位于本地的通用词库中的词和已经加载到本地的领域专业词库中的词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010551084.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卫浴装置的托盘式隐藏操作面板
- 下一篇:一种药片表面缺损、杂质检测机