[发明专利]一种输入纠错方法和装置有效
申请号: | 201711484183.9 | 申请日: | 2017-12-29 |
公开(公告)号: | CN109992120B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 陈小帅;臧娇娇 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/126;G06F40/194;G06F40/279;G06F40/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 输入 纠错 方法 装置 | ||
1.一种输入纠错方法,其特征在于,所述方法包括:
获取用户输入的、尚未提交到交互会话中的输入字符串;
从所述交互会话中已上屏的字符串中确定出对应所述输入字符串的目标字符串;
根据所述目标字符串确定所述输入字符串中是否具有错误字符串;
在确定所述输入字符串中具有错误字符串之后,所述方法还包括:
若得到所述输入字符串所输入编码中的子输入编码与所述目标字符串对应编码中的子编码符合编码相似条件,将所述子输入编码对应的字符确定为所述错误字符串;
确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子编码对应的字符;
确定所述待定字符与所述目标字符串的相关概率;
若所述语言模型得分和所述相关概率确定所述待定字符满足纠错条件,将所述待定字符确定为针对所述错误字符串对应的纠错候选项;
或者,
在确定所述输入字符串中具有错误字符串之后,所述方法还包括:
若所述输入字符串的子输入字符与所述目标字符串的子字符符合组成相似条件,将所述子输入字符确定为所述错误字符串;
确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子字符;
确定所述待定字符与所述目标字符串的相关概率;
若所述语言模型得分和所述相关概率确定所述待定字符满足纠错条件,将所述待定字符确定为针对所述错误字符串对应的纠错候选项。
2.根据权利要求1所述的方法,其特征在于,所述目标字符串为以下任意一种或多种的组合:
所述交互会话中上屏时间距所述输入字符串的输入时间较近的已上屏的字符串中的一个;
所述交互会话中尚未被回复的已上屏的字符串;
所述交互会话中语义通顺的已上屏的字符串。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标字符串确定所述输入字符串中是否具有错误字符串,包括:
判断所述输入字符串与所述目标字符串间的语义相关性;
若所述语义相关性低于预设条件,确定所述输入字符串中具有错误字符串。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标字符串确定所述输入字符串中是否具有错误字符串,包括
确定所述目标字符串对应的智能回复内容;
若所述输入字符串与所述智能回复内容的相似度符合回复相似条件,确定所述输入字符串中具有错误字符串。
5.根据权利要求4所述的方法,其特征在于,在所述确定所述输入字符串中具有错误字符串之后,所述方法还包括:
若得到所述输入字符串所输入编码中的子输入编码与所述智能回复内容对应编码中的子编码符合编码相似条件,将所述子输入编码对应的字符确定为所述错误字符串;或者,
若所述输入字符串的子输入字符与所述智能回复内容的子字符符合组成相似条件,将所述子输入字符确定为所述错误字符串。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标字符串确定出针对所述错误字符串的纠错候选项,包括:
根据所述子编码对应的字符确定出所述错误字符串对应的纠错候选项;或者,
根据所述子字符确定出所述错误字符串对应的纠错候选项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711484183.9/1.html,转载请声明来源钻瓜专利网。