[发明专利]纠错方法和装置、计算机可读介质有效
申请号: | 201910130735.9 | 申请日: | 2019-02-21 |
公开(公告)号: | CN109885180B | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 林泽南;卢佳俊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F40/232;G06F40/242 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;刘悦晗 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 纠错 方法 装置 计算机 可读 介质 | ||
本公开提供了一种纠错方法,该方法包括:基于接收到的查询请求,从预设的字典树中确定多个目标候选实体,计算每个目标候选实体为合法实体的第一概率,对每个目标候选实体进行评估,得到评估的结果,其中,一个目标候选实体对应一个评估的结果,基于第一概率和评估的结果确定查询请求对应的真实意图实体。通过本公开实施例提供的技术方案,避免了现有技术中纠错效果不佳的问题,实现了降低纠错成本,提高纠错效率和准确率的技术效果。本公开还提供了一种纠错装置、计算机可读介质。
技术领域
本公开实施例涉及互联网技术领域,特别涉及纠错方法和装置、计算机可读介质。
背景技术
在信息化蓬勃发展的今天,网络已经延伸到社会的方方面面,交互设备越来越普遍。用户可通过键盘键入等方式输入查询请求,交互设备根据预置的标准映射将该查询请求转换为相应的候选项并展示,以便用户对候选项进行选择。
在实际应用中,由于输入法、按错键盘等,会造成用户所搜时输入的查询请求存在错误,则搜索引擎返回的搜索结果与用户期待的结果存在明显的差异(因为搜索引擎无法正确纠错此类错误查询请求)。
发明内容
本公开实施例提供一种纠错方法和装置、计算机可读介质。
根据本公开实施例的一个方面,本公开实施例提供了一种纠错方法,包括:
基于接收到的查询请求,从预设的字典树中确定多个目标候选实体;
计算每个所述目标候选实体为合法实体的第一概率;
对每个所述目标候选实体进行评估,得到评估的结果,其中,一个所述目标候选实体对应一个评估的结果;
基于所述第一概率和所述评估的结果确定所述查询请求对应的真实意图实体。
在一些实施例中,在基于接收到的查询请求,从预设的字典树中确定多个目标候选实体之前,还包括:
计算所述查询请求输入正确的第二概率;
所述基于接收到的查询请求,从预设的字典树中确定多个目标候选实体,具体包括:
响应于所述第二概率小于预设的第一阈值,基于接收到的查询请求,从所述字典树中确定所述目标候选实体。
在一些实施例中,所述基于接收到的查询请求,从预设的字典树中确定多个目标候实体,具体包括:
对所述查询请求中的字符串和所述字典树进行计算,得到多个初始候选实体;
基于预设的第二阈值,从多个所述初始候选实体中选取与所述查询请求对应的所述目标候选实体。
在一些实施例中,所述基于预设的第二阈值,从多个所述初始候选实体中选取与所述查询请求对应的所述目标候选实体,包括:
计算每个所述初始候选实体与所述查询请求的第一距离;
将每个所述第一距离分别与所述第二阈值进行比较;
将小于或等于所述第二阈值的第一距离对应的初始候选实体确定为所述目标候选实体。
在一些实施例中,如果所述第二阈值包括第三阈值和第四阈值,则所述基于预设的第二阈值,从多个所述初始候选实体中选取与所述查询请求对应的所述目标候选实体,包括:
基于第一算法计算每个所述初始候选实体与所述查询请求的第二距离;
将所述第二距离与所述第三阈值进行比较;
从多个所述初始候选实体中提取小于或等于所述第三阈值的第二距离对应的第一候选实体;
基于第二算法计算每个所述第一候选实体与所述查询请求的第三距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910130735.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制输入字符数的计算设备及其方法
- 下一篇:一种软件实现按键组合控制方式