[发明专利]一种泛化处理的方法、装置、设备和计算机存储介质有效
申请号: | 202011445266.9 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112541362B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 陈艳;刘凯;刘璟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N20/00 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 泛化 处理 方法 装置 设备 计算机 存储 介质 | ||
本申请公开了一种泛化处理的方法、装置、设备和计算机存储介质,涉及人工智能技术领域,具体涉及深度学习技术。具体实现方案为:通过字面匹配方式、语义匹配方式和查询项(query)改写方式中的至少一种,确定query库中与所请求query相似的候选query集合;利用预先训练得到的query匹配模型,从所述候选query集合中确定所述所请求query对应的泛化query;其中所述query匹配模型基于交叉注意力模型预先训练得到。通过本申请能够实现针对所请求query的泛化。
技术领域
本申请涉及计算机应用技术领域,特别涉及人工智能技术领域中的深度学习技术。
背景技术
信息爆炸时代,人们渴望能够快速、准确、直接地获取信息,传统的搜索引擎技术已经不能满足用户的需求。问答系统作为搜索引擎的高级形式,用最简单、高效的方式满足用户快速、精准获取信息的需求。问题泛化是问答系统中的核心技术,对于给定的query(查询项),可返回该query的所有同义query,从而提高响应的准确率和召回率。由此泛化技术被广泛运用于搜索、问答系统、智能客服、广告系统等多种业务场景中。
发明内容
有鉴于此,本申请提供了一种泛化处理的方法、装置、设备和计算机存储介质。
第一方面,本申请提供了一种泛化处理的方法,包括:
通过字面匹配方式、语义匹配方式和query改写方式中的至少一种,确定查询项query库中与所请求query相似的候选query集合;
利用预先训练得到的query匹配模型,从所述候选query集合中确定所述所请求query对应的泛化query;
其中所述query匹配模型基于交叉注意力模型预先训练得到。
第二方面,本申请提供了一种泛化处理的装置,包括:
候选确定模块,用于通过字面匹配方式、语义匹配方式和query改写方式中的至少一种,确定查询项query库中与所请求query相似的候选query集合;
泛化确定模块,用于利用预先训练得到的query匹配模型,从所述候选query集合中确定所述所请求query对应的泛化query;其中所述query匹配模型基于交叉注意力模型预先训练得到。
第三方面,本申请提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的方法。
第四方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述的方法。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一项所述的方法。
由以上技术方案可以看出,通过字面匹配、语义匹配和query改写中至少一种方式先确定出候选query集合,再进一步通过query匹配模型从候选query集合中进一步确定泛化query,从而实现针对所请求query的泛化。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的主要方法流程图;
图2为本申请实施例提供的一种优选方法流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011445266.9/2.html,转载请声明来源钻瓜专利网。