[发明专利]一种汉字输入方法和装置有效
申请号: | 201110020045.1 | 申请日: | 2011-01-13 |
公开(公告)号: | CN102591472A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | 蔡衡 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 中国商标专利事务所有限公司 11234 | 代理人: | 万学堂 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汉字输入 方法 装置 | ||
技术领域
本发明涉及一种字符输入技术,尤其涉及一种汉字输入方法和装置。
背景技术
我们需要使用输入法输入想要表达的信息,有些人喜欢一句一句的输入,而有些人偏向于一个词一个词的输入。我们知道同一个拼音串通常对应多个汉字串,该汉字串可能是词组或者句子。目前输入法主要根据日常生活中某些词、词组以及英文单词出现频率以及用户输入的历史,按照降序对这些词、词组以及英文单词进行排列。例如,当输入一个拼音串“xian’cheng”的时候,输入法首先从字典中找到拼音“xian’cheng”对应的所有词条:“贤成”、“现成”、“县城”、“线程”、“先成”、“鲜橙”等。“县城”的权重高于“现成”和其他所有词的权重,于是此时“县城”作为候选词出现在“现成”的前面。若选择了词条“现成”,由于用户曾经输入过词条“现成”,当再次输入拼音串“xian’cheng”时,若根据输入历史优先原则,此时候选词“现成”就会排在了“县城”的前面。
如图1所示,下面介绍现有技术的输入方法。
步骤101、获取拼音串。
步骤102、从字典中获取与拼音串对应的各个词条、词条的权重以及该词条历史输入的次数。
步骤103、对每一词条,根据词条的权重和历史输入的次数计算出该词条的排序权重。
步骤104、将拼音串对应的各个词条按照其排序权重进行降序排列,得到输入法的候选词的最终排序结果;并根据排序结果输入该拼音串对应的词条。
目前的输入技术虽然在一定程度上能够较好地满足当前用户输入的需求,然而,本申请的发明人发现,在词条之间有着上下文之间的联系,充分利用当前输入的上下文联系能够更好的帮助用户进行输入,当前的输入法并没有利用输入上下文的关系。例如:我们知道“暗黑骑士”是一个词语,所以词条“暗黑”和“骑士”有一定的联系。当用户输入“暗黑”之后,在输入拼音串“qi’shi”之后,首选词是“其实”。现有技术使用的动态排序方法,并没有完全挖掘出当前的输入场景、充分利用用户输入的上下文和输入的拼音串之间的关系,以致使输入法首选词的首选率不高。所述首选词是指,输入拼音串对应的候选词的第一个词,首选词能够使用户更加方便和快速的输入汉字,首选词的正确率叫做首选率,首选率是评价输入法质量的重要指标。
发明内容
本发明的实施例提供了一种汉字输入方法和装置,可解决现有技术首选率不高的问题。
本发明的实施例提供了一种汉字输入方法,包括:
获取拼音串;
获取当前输入的上下文,所述当前输入的上下文包括所述拼音串对应的候选词词条和当前输入的前面的词;
获取与拼音串对应的各个候选词词条的权重、该词条历史输入的次数、该词条的偏移权重,该词条的偏移权重是指该词条与当前输入的前面的词的偏移权重;
对每一词条,根据词条的权重、该词条的偏移权重和历史输入的次数计算出该词条的排序权重;
将拼音串对应的各个词条按照其排序权重进行降序排列,得到输入法的候选词的最终排序结果;并根据排序结果输入该拼音串对应的词条。
所述当前输入的前面的词为当前输入的前一个词。
计算排序权重的公式如下:
Weightpaixu(W)=Weight(W)+a×Time(W)+b×Weightpianyi(W)…(1)
其中a、b是常数;W代表了当前词条;Weightpaixu(W)是词条W的排序权重,Weight(W)是词条W的权重,Time(W)是词条W的历史输入的次数;Weightpianyi(W)是词条W的偏移权重。
本发明还提供了一种汉字输入装置,其包括:拼音获得模块、上下文获得模块、查询模块、计算模块、输入模块;
所述拼音获得模块用于获取拼音串;
上下文获取模块用于获取当前输入的上下文,所述上下文包括所述拼音串对应的候选词词条和当前输入的前一个词;
查询模块用于获取与拼音串对应的候选词词条的权重、该词条的历史输入的次数、及该词条的偏移权重;
计算模块用于根据每一词条的权重、该词条的偏移权重和词条的历史输入的次数计算该词条的排序权重;
输入模块用于将拼音串对应的各个词条按照其排序权重进行降序排列,得到输入法的候选词的最终排序结果;并根据排序结果输入该拼音串对应的词条。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110020045.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种重叠文字的处理方法和装置
- 下一篇:货运安全监控系统