[发明专利]纠错方法和装置、计算机可读介质有效
申请号: | 201910130735.9 | 申请日: | 2019-02-21 |
公开(公告)号: | CN109885180B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 林泽南;卢佳俊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/232;G06F40/242 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;刘悦晗 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 纠错 方法 装置 计算机 可读 介质 | ||
1.一种纠错方法,包括:
基于接收到的查询请求,从预设的字典树中确定多个目标候选实体;
计算每个所述目标候选实体为合法实体的第一概率;
对每个所述目标候选实体进行评估,得到评估的结果,其中,一个所述目标候选实体对应一个评估的结果;
基于所述第一概率和所述评估的结果确定所述查询请求对应的真实意图实体;
其中,所述对每个所述目标候选实体进行评估,包括:提取每个所述目标候选实体对应的属性信息;确定每个所述目标候选实体的属性信息的权重;基于所述权重对每个所述目标候选实体进行评估;
其中,所述基于所述第一概率和所述评估的结果确定所述查询请求对应的真实意图实体,具体包括:
对每个所述目标候选实体对应的第一概率和评估的结果进行加权,得到每个所述目标候选实体对应的加权值;
将最大的加权值对应的目标候选实体确定为所述真实意图实体。
2.根据权利要求1所述的方法,其中,在所述基于接收的查询请求,从预设的字典树中确定多个目标候选实体之前,还包括:
计算所述查询请求输入正确的第二概率;
所述基于接收的查询请求,从预设的字典树中确定多个目标候选实体,包括:
响应于所述第二概率小于预设的第一阈值,基于接收的查询请求,从所述字典树中确定所述目标候选实体。
3.根据权利要求1所述的方法,其中,所述基于接收到的查询请求,从预设的字典树中确定多个目标候选实体,包括:
对所述查询请求中的字符串和所述字典树进行计算,得到多个初始候选实体;
基于预设的第二阈值,从多个所述初始候选实体中选取与所述查询请求对应的所述目标候选实体。
4.根据权利要求3所述的方法,其中,所述基于预设的第二阈值,从多个所述初始候选实体中选取与所述查询请求对应的所述目标候选实体,包括:
计算每个所述初始候选实体与所述查询请求的第一距离;
将每个所述第一距离分别与所述第二阈值进行比较;
将小于或等于所述第二阈值的第一距离对应的初始候选实体确定为所述目标候选实体。
5.根据权利要求3所述的方法,其中,如果所述第二阈值包括第三阈值和第四阈值,则所述基于预设的第二阈值,从多个所述初始候选实体中选取与所述查询请求对应的所述目标候选实体,包括:
基于第一算法计算每个所述初始候选实体与所述查询请求的第二距离;
将所述第二距离与所述第三阈值进行比较;
从多个所述初始候选实体中提取小于或等于所述第三阈值的第二距离对应的第一候选实体;
基于第二算法计算每个所述第一候选实体与所述查询请求的第三距离;
将小于或等于所述第四阈值的第三距离对应的第一候选实体确定为所述目标候选实体。
6.根据权利要求5所述的方法,其中,
如果所述第一算法为编辑距离算法,则第二算法为杰卡德距离算法;
如果所述第一算法为所述杰卡德距离算法,则所述第二算法为所述编辑距离算法。
7.根据权利要求1至6中任一项所述的方法,其中,还包括:
从预设知识库中提取多个实体;
将每个所述实体作为预设字典树的节点,将每个所述实体的实体义项作为其所属实体的子节点,并为每个所述实体义项分配唯一的标识,得到所述字典树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910130735.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:控制输入字符数的计算设备及其方法
- 下一篇:一种软件实现按键组合控制方式