[发明专利]一种纠错词库的建立方法和装置有效
申请号: | 201710570569.5 | 申请日: | 2017-07-13 |
公开(公告)号: | CN109271037B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 左艳波 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纠错 词库 建立 方法 装置 | ||
1.一种纠错词库的建立方法,其特征在于,所述方法包括:
识别用户输入字符串的输入行为,所输入的字符串对应至少一个候选字;
若识别出所述用户未选择第一输入行为中第一字符串对应的候选字,而选择了第二输入行为中第二字符串对应的候选字,保存所述第一字符串与第二字符串的对应关系,所述第二输入行为是后于所述第一输入行为产生的、且与所述第一输入行为相邻产生的输入行为,所述第一字符串在所述第一输入行为输入字符串中所处的音节位置与所述第二字符串在所述第二输入行为输入字符串中所处的音节位置相同;
根据所述第一字符串与第二字符串的对应关系建立针对所述用户的纠错词库;所述纠错词库与使用输入法的用户一一对应;
若获取了所述用户输入的所述第一字符串,根据所述第一字符串从所述纠错词库查询得到所述第二字符串;
将所述第二字符串对应的候选字作为所述用户输入的所述第一字符串对应的候选字;
根据所述第二字符串对应的候选字被选择上屏的热度,从所述第二字符串对应的候选字中选择高热度的部分候选字,并将所述部分候选字的热度与所述第一字符串对应的候选字的热度进行比较,根据各个候选字的热度高低来调整所述第一字符串对应的候选字的展示位置,在所述第一字符串对应的候选字展示界面中的部分候选字展示位置展示所述第二字符串对应的候选字中热度最高的候选字,所述候选字展示界面为用于展示候选字的界面,包括了多个候选字展示位置;所述第二字符串对应的候选字被选择上屏的热度,是根据用户个人在输错场景下的输入行为数据统计得到的,所述输错场景是指是所述用户未选择第一输入行为中第一字符串对应的候选字,而选择了第二输入行为中第二字符串对应的候选字的情况。
2.根据权利要求1所述的方法,其特征在于,所述保存所述第一字符串与第二字符串的对应关系,包括:
记录识别出所述用户未选择第一输入行为中第一字符串对应的候选字,而选择了第二输入行为中第二字符串对应的候选字的次数;
若所述次数满足阈值,保存所述第一字符串与第二字符串的对应关系。
3.根据权利要求1所述的方法,其特征在于,所述第二字符串为在所述第一输入行为中所输入第一字符串的基础上修改得到的;或者
所述第二字符串为在取消了所述第一输入行为所输入字符串后输入的。
4.一种纠错词库的建立装置,其特征在于,所述装置包括识别单元、保存单元、建立单元替换单元、查询单元和展示单元:
所述识别单元,用于识别用户输入字符串的输入行为,所输入的字符串对应至少一个候选字;
所述保存单元,用于若所述识别单元识别出所述用户未选择第一输入行为中第一字符串对应的候选字,而选择了第二输入行为中第二字符串对应的候选字,保存所述第一字符串与第二字符串的对应关系,所述第二输入行为是后于所述第一输入行为产生的、且与所述第一输入行为相邻产生的输入行为,所述第一字符串在所述第一输入行为输入字符串中所处的音节位置与所述第二字符串在所述第二输入行为输入字符串中所处的音节位置相同;
所述建立单元,用于根据所述第一字符串与第二字符串的对应关系建立针对所述用户的纠错词库;所述纠错词库与使用输入法的用户一一对应;
所述查询单元,用于若获取了所述用户输入的所述第一字符串,根据所述第一字符串从所述纠错词库查询得到所述第二字符串;
所述替换单元,用于将所述第二字符串对应的候选字作为所述用户输入的所述第一字符串对应的候选字;
所述展示单元,用于根据所述第二字符串对应的候选字被选择上屏的热度,从所述第二字符串对应的候选字中选择高热度的部分候选字,并将所述部分候选字的热度与所述第一字符串对应的候选字的热度进行比较,根据各个候选字的热度高低来调整所述第一字符串对应的候选字的展示位置,在所述第一字符串对应的候选字展示界面中的部分候选字展示位置展示所述第二字符串对应的候选字中热度最高的候选字,所述候选字展示界面为用于展示候选字的界面,包括了多个候选字展示位置;所述第二字符串对应的候选字被选择上屏的热度,是根据用户个人在输错场景下的输入行为数据统计得到的,所述输错场景是指是所述用户未选择第一输入行为中第一字符串对应的候选字,而选择了第二输入行为中第二字符串对应的候选字的情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710570569.5/1.html,转载请声明来源钻瓜专利网。