[发明专利]搜索召回方法、装置、设备及其存储介质有效
申请号: | 201911126486.2 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110929125B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 陈诚;冯帅;邓威;王军伟;方高林;郑楚涛;郑黄晓为 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/953 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 召回 方法 装置 设备 及其 存储 介质 | ||
本申请公开了一种搜索召回方法、装置、设备及其存储介质。该方法包括:接收输入的查询词;对查询词进行查询意图识别得到召回特征向量,该召回特征向量包括第一特征,该第一特征是用于唯一标识查询词中的实体名的信息表示的;根据预先建立的倒排索引列表,从候选文档中召回与第一特征相关的目标文档,倒排索引列表是预先对候选文档进行命名实体识别处理后建立的,倒排索引列表包括第一特征和至少一个文档标识之间的对应关系。根据本申请实施例的技术方案,通过用于唯一标识查询词中的实体名的信息表示查询词中的实体名,基于这个唯一标识的信息查找预先建立的倒排索引表,有效地提高召回结果的准确性。
技术领域
本申请涉及互联网技术领域,尤其涉及搜索召回方法、装置、设备及其存储介质。
背景技术
新闻资讯搜索功能为用户提供获取资讯结果的快捷渠道。搜索引擎根据用户输入的查询词语,在网络中召回与查询词语相关的查询结果,然后对查询结果进行排序,将排序靠前的查询结果展示给用户。
在搜索过程中,用户获得的结果虽然形式上是与查询词语相关联的,但是其实质内容确与用户查询目的不匹配。特别是,期望搜索与专业领域相关的查询结果时,基于查询词语获取的查询结果精准度不高。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种搜索召回方法、装置、设备及其存储介质,在资讯搜索过程中通过唯一标识资讯目标的方式,提高召回结果的准确性。
一方面,本申请实施例提供了一种搜索召回方法,其包括以下步骤:
接收输入的查询词;
对查询词进行查询意图识别得到召回特征向量,该召回特征向量包括第一特征,该第一特征是用于唯一标识查询词中的实体名的信息表示的;
根据预先建立的倒排索引列表,从候选文档中召回与第一特征相关的目标文档,倒排索引列表是预先对候选文档进行命名实体识别处理后建立的,倒排索引列表包括第一特征和至少一个文档标识之间的对应关系。
一方面,本申请实施例提供了一种搜索召回装置,其包括:
接收单元,用于接收输入的查询词;
识别单元,用于对查询词进行查询意图识别得到召回特征向量,该召回特征向量包括第一特征,该第一特征是用于唯一标识查询词中的实体名的信息表示的;
召回单元,用于根据预先建立的倒排索引列表,从候选文档中召回与第一特征相关的目标文档,倒排索引列表是预先对候选文档进行命名实体识别处理后建立的,倒排索引列表包括第一特征和至少一个文档标识之间的对应关系。
一方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描述的方法。
一方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于:
该计算机程序被处理器执行时实现如本申请实施例描述的方法。
本申请实施例提供的搜索召回方法、装置及其设备和存储介质,通过对接收的查询词,进行查询意图识别,构建查询词中包含的实体名的统一标注,即通过用于唯一标识查询词中的实体名的信息表示查询词中的实体名,基于这个唯一标识的信息查找预先建立的倒排索引表,该倒排索引列表也是预先基于命名实体识别处理后建立的,通过这种统一标注方式,有效地提高召回结果的准确性。
可选地,在排序阶段引用上述统一标注的排序特征,通过该排序特征可以将召回结果进行优化排序后提供给用户,提高了展示效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911126486.2/2.html,转载请声明来源钻瓜专利网。