[发明专利]一种输入纠错方法和装置、一种用于输入纠错的装置有效
申请号: | 201610884238.4 | 申请日: | 2016-10-10 |
公开(公告)号: | CN107918496B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 费腾 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 刘祥景 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 输入 纠错 方法 装置 用于 | ||
1.一种输入纠错方法,其特征在于,包括:
获取输入过程中的输入串;
对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;
依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;
依据所述查找结果,对所述输入串对应的纠错候选进行排序;
向用户展现排序后的纠错候选;
在所述对所述输入串进行纠错处理的步骤之前,所述方法还包括:
依据所述输入串对应的普通候选和上下文,在用户多元词库中进行查找;
当所述输入串对应的普通候选和上下文命中所述用户多元词库时,不执行所述对所述输入串进行纠错处理的步骤。
2.根据权利要求1所述的方法,其特征在于,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:
依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;
将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;
依据所述第三得分对所述输入串对应的纠错候选进行排序。
3.根据权利要求1所述的方法,其特征在于,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:
依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;
将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;
依据所述第五得分对所述输入串对应的纠错候选进行排序。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者
依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。
5.根据权利要求4所述的方法,其特征在于,所述多元词组的属性特征包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则所述依据用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分的步骤,包括:
依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分和/或第四得分。
6.根据权利要求2所述的方法,其特征在于,所述纠错候选的属性特征包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输入串之间的编辑距离、所述纠错候选所对应词库的类型和所述纠错候选的词频。
7.根据权利要求1至3中任一所述的方法,其特征在于,当所述在用户多元词库中查找的查找结果包括:多个命中的纠错候选时,所述方法还包括:
依据所述用户多元词库中记录的多元词组的属性特征,对多个命中的纠错候选进行排序;
依据所述多个命中的纠错候选的排序结果,展现对应的纠错候选。
8.根据权利要求1至3中任一所述的方法,其特征在于,通过如下步骤建立所述用户多元词库:
记录用户的上屏内容;
从一次上屏内容或者连续的多次上屏内容中选择用户多元词组;
将所述用户多元词组及其对应的属性特征保存至用户多元词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610884238.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于销售点使用的通用颜料制剂
- 下一篇:用于销售点使用的通用颜料制剂