[发明专利]一种基于向量空间的RDF结构化查询自动构建方法有效
申请号: | 201811197729.7 | 申请日: | 2018-10-15 |
公开(公告)号: | CN109408527B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 王瑞杰;刘均;王萌 | 申请(专利权)人: | 广东顺德西安交通大学研究院 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2453;G06F16/36 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 528399 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 向量 空间 rdf 结构 查询 自动 构建 方法 | ||
1.一种基于向量空间的RDF结构化查询自动构建方法,其特征在于,首先利用概括局部子图将RDF图映射到连续向量空间中,学习RDF图中每个节点与边的向量表示;然后给定通过自然语言问题表达的查询意图后,提取问题中的实体、关系短语,并在RDF图中匹配得到候选匹配节点、边;再利用RDF图的向量表示将候选匹配节点、边的集合表示为向量并计算最优查询结构;最后利用翻译机制选取每个候选集合中的最优匹配节点、边并生成目标结构化查询;
利用概括局部子图将RDF图映射到连续向量空间中,学习RDF图中每个节点与边的向量表示具体包括以下步骤:
S101、设为RDF图中节点的集合,ε为RDF图中边的集合;一条RDF三元组为(vh,e,vt),其中,即头节点vh由边e指向尾节点vt,一个RDF图是RDF三元组的有限集合;
S102、对于RDF图中的一个节点其局部子图为三元组集合如下:
对于RDF图中的一个边e∈ε,其局部子图为:
S103、对于RDF图中的一个实体节点其概括局部子图如下:
其中,vc'为实体节点v'e所对应的类别节点;
S104、对于RDF图中的每一个节点v与边e,利用其概括局部子图学习其在连续向量空间中的向量表示,即v与e;该学习过程在离线阶段完成,学习得到的向量表示在后续在线的RDF结构化查询构建中直接使用;
利用翻译机制选取每个候选集合中的最优匹配节点、边并生成目标结构化查询包括以下步骤:
S401、基于计算得到的最优结构,通过从每个候选匹配节点/边集合中选取一个节点/边可以构建多个可能的结构化查询表示QR;
S402、对于每个可能的结构化查询表示,在此计算其损失值f4(QR);
S403、损失值最小的结构化查询表示为最优的,将其中的类别节点替换为变量,并将变量通过表示类别的边指向原本的类别节点,得到自然语言问题所对应的RDF结构化查询,多个可能的结构化查询表示QR表示如下:
损失值f4(QR)表示如下:
。
2.根据权利要求1所述的基于向量空间的RDF结构化查询自动构建方法,其特征在于,步骤S103中,对于RDF图中的一个类别节点其概括局部子图为:
其中,vc为实体节点ve所对应的类别节点;
对于RDF图中的一个边e∈ε,其概括局部子图为:
其中,vc,vc'为实体节点ve,ve'所对应的类别节点。
3.根据权利要求2所述的基于向量空间的RDF结构化查询自动构建方法,其特征在于,步骤S104中,在分别给定节点v与边e的概括局部子图与的条件下,定义得到节点v与边e的条件概率,通过最大化RDF图中所有节点与边的联合概率,学习得到RDF图的向量表示;
节点v的条件概率如下:
其中,是一个用于度量节点v′与概括局部子图之间相互关系的函数;
RDF图中节点的向量表示通过最大化以下联合概率得到:
边e的条件概率如下:
其中,是一个用于度量节点e′与概括局部子图之间相互关系的函数;
RDF图中边的向量表示通过最大化以下联合概率得到:
同时考虑节点与边的联合概率,通过最大化目标函数得到RDF图的向量表示如下:
O=λvOv+λeOe
其中,λv与λe为权值系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东顺德西安交通大学研究院,未经广东顺德西安交通大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811197729.7/1.html,转载请声明来源钻瓜专利网。