[发明专利]用于处理查询文本的方法、装置、设备、介质和程序有效

专利信息
申请号: 202011511011.8 申请日: 2020-12-18
公开(公告)号: CN112507198B 公开(公告)日: 2022-09-23
发明(设计)人: 林英展;林大勇;陈炳金;陈万顺;黄世维 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F16/953 分类号: G06F16/953;G06K9/62
代理公司: 北京市金杜律师事务所 11256 代理人: 赵林琳;姚杰
地址: 100094 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 处理 查询 文本 方法 装置 设备 介质 程序
【说明书】:

本公开公开了用于处理查询文本的方法、装置、设备、介质和程序,涉及数据处理领域,尤其涉及智能搜索领域。具体实现方案为:基于从查询文本获得的关键短语,从结构化数据集合中获取一组候选短语,一组候选短语中的候选短语与关键短语具有至少一个相同的文字单元;基于相同的文字单元的数目,确定关键短语与候选短语之间的目标相似度,目标相似度指示关键短语和候选短语之间的匹配程度;以及基于目标相似度从一组候选短语中选择目标短语。通过该方法,可以避免标注的高成本,同时改时了扩展的效果,提高获取的查询结果的准确率。

技术领域

本公开涉及数据处理技术领域,尤其涉及智能搜索领域的处理查询文本的方法、装置、设备、介质和程序。

背景技术

随着信息技术的快速发展,可用的数据量越来越多。对于大量的数据,设计了很多可以从大量数据查询有用信息的方法和算法。例如,现在有很多搜索引擎可用于帮助用户查询各种信息。

随着技术的发展,出现了结构化知识问答。这种问答是基于语义理解和知识匹配的通用问答技术。一般只需要提供结构化的表格,便能快速的建立支持复杂查询的精准问答服务。然而,在这种结构化知识问答的处理过程中还存在许多需要解决的问题。

发明内容

本公开提供了一种用于处理查询文本的方法、装置、设备、介质和程序。

根据本公开的第一方面,提供了一种用于处理查询文本的方法。该方法包括:基于从查询文本获得的关键短语,从结构化数据集合中获取一组候选短语,一组候选短语中的候选短语与关键短语具有至少一个相同的文字单元。该方法还包括基于相同的文字单元的数目,确定关键短语与候选短语之间的目标相似度,目标相似度指示关键短语和候选短语之间的匹配程度。该方法还包括基于目标相似度从一组候选短语中选择目标短语。

根据本公开的第二方面,提供了一种用于处理查询文本的装置。该装置包括一组候选短语获取模块,被配置为基于从查询文本获得的关键短语,从结构化数据集合中获取一组候选短语,一组候选短语中的候选短语与关键短语具有至少一个相同的文字单元;目标相似度确定模块,被配置为基于相同的文字单元的数目,确定关键短语与候选短语之间的目标相似度,目标相似度指示关键短语和候选短语之间的匹配程度;以及目标短语选择模块,被配置为基于目标相似度从一组候选短语中选择目标短语。

根据本公开的第三方面,提供了一种电子设备。该电子设备包括至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开的第一方面的方法。

根据本公开的第四方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行根据本公开的第一方面的方法。

根据本公开的第五方面,提供一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本公开的第一方面的方法的步骤。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1示出了本公开的多个实施例能够在其中实现的环境100的示意图;

图2示出了根据本公开的一些实施例的用于处理查询文本的方法200的流程图;

图3示出了根据本公开的一些实施例的用于处理查询文本的方法300的流程图;

图4示出了根据本公开的一些实施例的用于处理查询文本的装置400的框图;以及

图5示出了能够实施本公开的多个实施例的设备500的框图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011511011.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top