[发明专利]检索数据的方法、装置、设备以及存储介质有效
申请号: | 202211742729.7 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115982466B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 卢宇翔;孙一博;刘佳祥;冯仕堃;黄世维 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/958 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李世阳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 数据 方法 装置 设备 以及 存储 介质 | ||
1.一种检索数据的方法,包括:
确定检索词的第一文本特征和第一数值特征;
确定所述检索词对应的至少一个候选数据;
确定至少一个候选数据中每个候选数据的第二文本特征和第二数值特征;
根据所述第一文本特征、所述第一数值特征、所述每个候选数据的第二文本特征和第二数值特征,确定所述每个候选数据的匹配分数,其中,所述匹配分数用于表示所述候选数据与所述检索词之间的匹配程度;以及
根据匹配分数,确定所述至少一个候选数据中的目标数据;
其中,所述根据所述第一文本特征、所述第一数值特征、所述每个候选数据的第二文本特征和第二数值特征,确定所述每个候选数据的匹配分数,包括:针对所述每个候选数据,
根据所述第一文本特征和所述候选数据的第二文本特征,确定文本匹配特征;
根据所述第一数值特征和所述候选数据的第二数值特征,确定数值匹配特征,包括:将所述第一数值特征与所述候选数据的第二数值特征进行拼接,得到数值拼接特征,其中,所述数值拼接特征包括多个数值;对所述数值拼接特征中的每个数值进行向量化,得到多个第一向量,其中,所述多个第一向量与所述多个数值一一对应;对所述多个第一向量中的每个第一向量进行特征混合,得到多个第二向量;以及将所述多个第二向量进行拼接,得到所述数值匹配特征;
将所述文本匹配特征、所述数值匹配特征和所述数值拼接特征拼接,得到目标向量;以及
对所述目标向量进行特征混合,得到所述匹配分数。
2. 根据权利要求1所述的方法,其中,所述根据所述第一文本特征和所述候选数据的第二文本特征,确定文本匹配特征,包括:
将所述第一文本特征和所述候选数据的第二文本特征进行拼接,得到文本拼接特征;以及
将所述文本拼接特征输入预训练语言模型,得到所述文本匹配特征。
3.根据权利要求1所述的方法,还包括:
对所述数值拼接特征中的每个数值进行平滑处理。
4.根据权利要求1所述的方法,其中,所述第一文本特征包括:所述检索词的文本内容;以及
所述第一数值特征包括以下至少一个:所述检索词的历史搜索次数、所述检索词的历史点击次数和所述检索词的点击率。
5.根据权利要求1所述的方法,其中,候选数据包括兴趣点,所述第二文本特征包括以下至少一个:所述兴趣点的名称、所述兴趣点的位置和所述兴趣点的类型;以及
所述第二数值特征包括以下至少一个:所述兴趣点的历史搜索次数、所述兴趣点的历史点击次数和所述兴趣点的点击率。
6.根据权利要求1所述的方法,其中,候选数据包括网页,所述第二文本特征包括以下至少一个:所述网页的标题、所述网页的摘要;以及
所述第二数值特征包括以下至少一个:所述网页的历史搜索次数、所述网页的历史点击次数和所述网页的点击率。
7. 根据权利要求1所述的方法,其中,所述确定所述检索词对应的至少一个候选数据,包括:
对所述检索词进行意图识别,得到意图识别结果;以及
确定多个数据中与所述意图识别结果之间的相关度高于相关度阈值的数据,作为所述候选数据。
8.根据权利要求1所述的方法,其中,所述根据匹配分数,确定所述至少一个候选数据中的目标数据,包括:
确定所述至少一个候选数据中匹配分数最高的候选数据,作为所述目标数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211742729.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置