[发明专利]查询请求补全方法、装置、电子设备和存储介质在审
申请号: | 202011476378.0 | 申请日: | 2020-12-14 |
公开(公告)号: | CN113779176A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 邹波;刘丹;邱立坤 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/332;G06F16/33;G06F16/35;G06F40/216;G06F40/295 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 请求 方法 装置 电子设备 存储 介质 | ||
1.一种查询请求补全方法,其特征在于,包括:
构造查询请求的标准化语料集;
基于所述标准化语料集构建前缀树;
在获取到用户输入的所述查询请求的前缀时,在所述前缀树中查询与所述前缀匹配的节点查询语料;
基于所述节点查询语料补全所述查询请求。
2.根据权利要求1所述的查询请求补全方法,其特征在于,所述构造查询请求的标准化语料集包括:
基于历史查询语料与对应的第一咨询量,和/或预存的用户与机器人之间的标准查询问句与对应的第二咨询量构造所述标准化语料集。
3.根据权利要求2所述的查询请求补全方法,其特征在于,所述基于历史查询语料与对应的第一咨询量,和/或预存的用户与机器人之间的标准查询问句与对应的第二咨询量构造所述标准化语料集包括:
基于预设筛选条件对历史查询语料执行筛选操作,基于筛选结果与所述第一咨询量生成第一语料集;
基于预设的意图分类获取对应的所述标准查询问句,以基于所述标准查询问句与所述第二咨询量生成第二语料集;
基于所述第一语料集和/或所述第二语料集生成所述标准化语料集。
4.根据权利要求3所述的查询请求补全方法,其特征在于,所述基于预设筛选条件对历史查询语料执行筛选操作,基于筛选结果与所述第一咨询量生成第一语料集包括:
选取自当前时刻向前预设时长内的与所述查询请求相关的对话日志;
删除所述对话日志中的停用词,生成待处理的语料集;
基于编辑距离算法提取所述待处理的语料集中的多类相似查询请求,并每类对所述相似查询请求进行合并处理,以得到多类合并查询请求;
统计每类所述相似查询请求的咨询量,以作为所述第一咨询量;
基于所述第一咨询量与咨询数量阈值之间的关系筛选所述多类合并查询请求,将筛选出的所述合并查询请求确定为所述第一语料集。
5.根据权利要求4所述的查询请求补全方法,其特征在于,还包括:
基于所述合并查询请求与所述第一咨询量生成问诊表;
所述基于所述标准查询问句与所述第二咨询量生成第二语料集包括:
将所述标准查询问句与所述问诊表进行相似度匹配,以确定所述第二咨询量;
基于所述标准查询问句与所述标准查询问句的咨询量生成所述第二语料集。
6.根据权利要求2至5中任一项所述的查询请求补全方法,其特征在于,所述基于所述标准化语料集构建前缀树包括:
对所述标准化语料集中的语料进行切词处理,以形成不同层的切词字符串;
基于所述第一咨询量和/或所述第二咨询量确定所述切词字符串的咨询次数;
将所述切词字符串作为边,将所述切词字符串的咨询次数作为节点,构建所述前缀树。
7.根据权利要求6所述的查询请求补全方法,其特征在于,所述将所述切词字符串作为边,将所述切词字符串的咨询次数作为节点,构建所述前缀树还包括:
针对每一层的所述切词字符串生成的所述节点,根据所述切词字符串的咨询次数进行排序,以构建所述前缀树。
8.根据权利要求6所述的查询请求补全方法,其特征在于,所述基于所述标准化语料集构建前缀树包括:
获取指定领域中的实体信息;
基于所述实体信息提取所述切词字符串中的实体字符;
采用同一泛化字符代替所述实体字符,以生成泛化的所述前缀树。
9.根据权利要求8所述的查询请求补全方法,其特征在于,所述在获取到用户输入的查询请求的前缀时,在所述前缀树中查询与所述前缀匹配的节点查询语料包括:
在获取到所述前缀时,基于命名体识别操作提取所述前缀中的所述实体字符;
采用所述泛化字符代替所述实体字符,以对所述实体字符进行泛化处理;
基于所述泛化字符与所述前缀中的其它字符在所述前缀树中执行查询操作,以得到对应的所述节点查询语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011476378.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光传感器结构
- 下一篇:一种具有心血管益处的GLP-1小分子