[发明专利]一种基于关键字上下文的SPARQL查询语句自动生成方法有效

专利信息
申请号: 201711344360.3 申请日: 2017-12-15
公开(公告)号: CN107992608B 公开(公告)日: 2021-07-02
发明(设计)人: 温延龙;靳宇东;袁晓洁 申请(专利权)人: 南开大学
主分类号: G06F16/242 分类号: G06F16/242
代理公司: 天津耀达律师事务所 12223 代理人: 侯力
地址: 300071*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于关键字上下文的SPARQL查询语句自动生成方法,属于数据库技术应用领域。包括:采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;构建包含节点在RDF标签图中位置信息的两层关键字索引;利用关键字索引将用户输入的关键字映射至RDF标签图中节点,采用后向搜索算法在RDF模式图中寻找包含关键字的子图;最后基于子图与用户查询意图的相关度对结果进行计分排序,将得分较高的结果转化为SPARQL查询语句。本发明提出的SPARQL查询语句自动生成方法,能够根据关键字准p确、高效地生成符合用户查询意图的SPARQL查询语句,达到帮助用户快速查询信息的目的。
搜索关键词: 一种 基于 关键字 上下文 sparql 查询 语句 自动 生成 方法
【主权项】:
一种基于关键字上下文的SPARQL查询语句自动生成方法,其特征在于该方法包括:第1、采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;第1.1、将RDF数据映射为一个标签图,定义1:RDF数据映射为一个标签图,用三元组G=(V,L,E)表示,其中:①.V=VE∪VC∪VL为顶点集,VE表示实体节点集合,VC表示类型节点集合,VL表示文字节点集合;②.L=LR∪LA∪{type,subClassOf}为边上标签集合,LR表示实体节点之间边的标签集合,LA表示连接实体节点和文字节点边的标签集合,type表示描述实体类型的标签,subClassOf表示描述类型层级关系的标签;③.为边集合,其中v1和v2为V中的元素,e为L中的元素,表示由v1指向v2的标签为e的边,满足以下条件:a)e∈LR当且仅当v1,v2∈VE,b)e∈LA当且仅当v1∈VE,v2∈VL,c)e=type当且仅当v1∈VE,v2∈VC,d)e=subClassOf当且仅当v1,v2∈VC;第1.2、对RDF标签图进行模式摘要处理,生成RDF模式图,定义2:一个RDF标签图G=(V,L,E)经过模式摘要处理生成一个RDF模式图,用三元组GS=(VS,LS,ES)表示,其中:①.VS=VC,LS=LR∪{subClassOf},其中v1S和v2S为VS中的元素,eS为LS中的元素,表示由v1S指向v2S的标签为eS的边;②.vS∈VS代表VE中所有vS类型的实体节点,即③.当且仅当对于v1∈[[v1S]]和v2∈[[v2S]]存在第2、构建包含节点在RDF标签图中位置信息的两层关键字索引;第2.1、为RDF标签图建立词表,定义3:一个RDF标签图G=(V,L,E)的词表为集合TG=TC∪TL∪TR∪TA,其中TC、TL、TR和TA分别表示VC、VL、LR和LA中词项的集合;第2.2、对TC和TR中词项建立倒排索引,将词项直接映射至RDF标签图中节点;对TL和TA中词项建立两层关键字索引,将词项通过包含RDF标签图中位置信息的B树结构映射至RDF标签图中节点;定义4:一个RDF标签图G=(V,L,E)中节点为一个三元组n=(vC,lA,vL),其中:①.vC∈VC,lA∈LA,vL∈VL;②.存在边type(v,vC)∈E和lA(v,vL)∈E;③.满足以下条件:a)lA=null,vL=null当且仅当词项出现在vC中;b)lA≠null,vL=null当且仅当词项出现在lA中;c)lA≠null,vL≠null当且仅当词项出现在vL中;d)vC≠null;定义5:一个RDF标签图中节点n=(vC,lA,vL)的位置信息为vC;第3、利用关键字索引将用户输入的关键字映射至RDF标签图中节点,采用后向搜索算法在RDF模式图中寻找包含关键字的子图;第3.1、对用户输入的关键字进行预处理,生成关键字查询,定义6:一个关键字查询为一个序列q={w1,...,wn},其中wi为词项;第3.2、利用倒排索引将关键字查询中的部分词项映射至RDF标签图中类型节点,并将这些节点及其在RDF模式图中的邻近节点的集合作为该查询的位置信息;第3.3、利用两层关键字索引,结合查询的位置信息将关键字查询中的其余词项映射至RDF标签图中实体节点和文字节点;第3.4、采用后向搜索算法在RDF模式图中寻找包含关键字的子图;第4、基于子图与用户查询意图的相关度对结果进行计分排序,将得分较高的结果转化为SPARQL查询语句;第4.1、根据用户输入关键字的上下文关系,对结果子图中包含关键字的节点与用户查询意图的相关度进行计分,包含关键字的节点称为关键字节点;第4.2、结合子图中关键字节点的得分和子图的路径长度,对结果子图进行计分排序,定义7:关键字节点n与用户查询意图的相关度记作score(n),结果子图的路径长度记作PL,则结果子图与用户查询意图的相关度定义为:第4.3、将得分较高的结果子图转化为SPARQL查询语句。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711344360.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top