[发明专利]基于人工智能的多域信息的匹配度评估方法、设备及介质有效
申请号: | 201710452619.X | 申请日: | 2017-06-15 |
公开(公告)号: | CN107291871B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 万圣贤;孙宇;于佃海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 信息 匹配 评估 方法 设备 介质 | ||
1.一种基于人工智能的多域信息的匹配度评估方法,其特征在于,所述方法包括:
分别获取查询query中的各有效单词,以及待查询文档中的至少两个信息域中各所述信息域中的各有效单词;
分别获取所述query中的各有效单词的单词表达以及所述待查询文档中的各所述信息域中的各有效单词的单词表达;
根据所述单词表达,分别获取所述query中的各有效单词的基于上下文的单词表达以及各所述信息域中的各有效单词的基于上下文的单词表达;
根据获取到的信息生成各所述信息域对应的匹配特征;
根据各所述信息域对应的所述匹配特征确定出所述query与所述待查询文档之间的匹配度评分;
根据获取到的信息生成各所述信息域对应的匹配特征,包括:
根据获取到的信息生成各所述信息域对应的局部匹配特征;
根据各所述信息域对应的局部匹配特征,生成对应所述信息域的高级匹配特征;各所述信息域对应的高级匹配特征具体是将对应的所述信息域的局部匹配特征输入至卷积神经网络中获取到的。
2.根据权利要求1所述的方法,其特征在于,所述分别获取query中的各有效单词的单词表达以及待查询文档中的至少两个信息域中各所述信息域中的各有效单词的单词表达,包括:
将所述query中的各有效单词分别embedding成一个低维向量,得到序列Qe=[q1,…,qi,…,qm];
其中,m表示所述query中包括的有效单词的单词数,qi表示所述query中的第i个有效单词的低维向量,i为正整数,且1≤i≤m;
将各所述信息域中的各有效单词分别embedding成一个低维向量,得到序列Te=[t1,…,tj,…,tn];
其中,n表示各所述信息域中包括的有效单词的单词数,tj表示所述信息域中的第j个有效单词的低维向量,j为正整数,且1≤j≤n。
3.根据权利要求2所述的方法,其特征在于,所述分别获取所述query中的各有效单词的基于上下文的单词表达以及各所述信息域中的各有效单词的基于上下文的单词表达,包括:
将所述Qe输入给双向循环神经网络RNN,分别得到从左向右方向处理后的输出Q1以及从右向左方向处理后的输出Q2;
将所述Te输入给双向RNN,分别得到从左向右方向处理后的输出T1以及从右向左方向处理后的输出T2;
将所述Qe、Q1和Q2进行拼接,得到Q(m,3d),所述d表示表达维度,embedding和双向RNN使用同样的表达维度;
将所述Te、T1和T2进行拼接,得到T(n,3d);
将所述query以及各所述信息域中的每个有效单词对应的长为3d的向量作为所述有效单词的基于上下文的单词表达。
4.根据权利要求1所述的方法,其特征在于,所述根据获取到的信息生成各所述信息域对应的局部匹配特征,包括:
在各所述信息域中,根据各有效单词的所述基于上下文的单词表达,分别按照不同的匹配度计算方式,计算出所述query中的有效单词与所述信息域中的有效单词两两之间的匹配度,得到所述信息域对应的三维的张量Tensor(m,n,t);
其中,t表示t维的向量,针对每组有效单词Q[i]和T[j],分别计算出t个匹配度,t个匹配度构成所述t维的向量,Q[i]表示所述query中的有效单词,T[j]表示所述信息域中的有效单词;
所述Tensor中的每一个值(i,j,k)表示Q[i]和T[j]对应的第k个匹配度,1≤k≤t。
5.根据权利要求4所述的方法,其特征在于,所述根据所述局部匹配特征生成各所述信息域对应的高级匹配特征,包括:
在各所述信息域中,将所述(m,n,t)输入给卷积神经网络CNN,将得到的输出(m,n,t1)、…、(m,n,tw)作为所述信息域对应的所述高级匹配特征,w为正整数,表示CNN中包括的卷积层数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710452619.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置