[发明专利]一种基于关键字上下文的SPARQL查询语句自动生成方法有效
申请号: | 201711344360.3 | 申请日: | 2017-12-15 |
公开(公告)号: | CN107992608B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 温延龙;靳宇东;袁晓洁 | 申请(专利权)人: | 南开大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于关键字上下文的SPARQL查询语句自动生成方法,属于数据库技术应用领域。包括:采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;构建包含节点在RDF标签图中位置信息的两层关键字索引;利用关键字索引将用户输入的关键字映射至RDF标签图中节点,采用后向搜索算法在RDF模式图中寻找包含关键字的子图;最后基于子图与用户查询意图的相关度对结果进行计分排序,将得分较高的结果转化为SPARQL查询语句。本发明提出的SPARQL查询语句自动生成方法,能够根据关键字准p确、高效地生成符合用户查询意图的SPARQL查询语句,达到帮助用户快速查询信息的目的。 | ||
搜索关键词: | 一种 基于 关键字 上下文 sparql 查询 语句 自动 生成 方法 | ||
【主权项】:
一种基于关键字上下文的SPARQL查询语句自动生成方法,其特征在于该方法包括:第1、采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;第1.1、将RDF数据映射为一个标签图,定义1:RDF数据映射为一个标签图,用三元组G=(V,L,E)表示,其中:①.V=VE∪VC∪VL为顶点集,VE表示实体节点集合,VC表示类型节点集合,VL表示文字节点集合;②.L=LR∪LA∪{type,subClassOf}为边上标签集合,LR表示实体节点之间边的标签集合,LA表示连接实体节点和文字节点边的标签集合,type表示描述实体类型的标签,subClassOf表示描述类型层级关系的标签;③.为边集合,其中v1和v2为V中的元素,e为L中的元素,表示由v1指向v2的标签为e的边,满足以下条件:a)e∈LR当且仅当v1,v2∈VE,b)e∈LA当且仅当v1∈VE,v2∈VL,c)e=type当且仅当v1∈VE,v2∈VC,d)e=subClassOf当且仅当v1,v2∈VC;第1.2、对RDF标签图进行模式摘要处理,生成RDF模式图,定义2:一个RDF标签图G=(V,L,E)经过模式摘要处理生成一个RDF模式图,用三元组GS=(VS,LS,ES)表示,其中:①.VS=VC,LS=LR∪{subClassOf},其中v1S和v2S为VS中的元素,eS为LS中的元素,表示由v1S指向v2S的标签为eS的边;②.vS∈VS代表VE中所有vS类型的实体节点,即③.当且仅当对于v1∈[[v1S]]和v2∈[[v2S]]存在第2、构建包含节点在RDF标签图中位置信息的两层关键字索引;第2.1、为RDF标签图建立词表,定义3:一个RDF标签图G=(V,L,E)的词表为集合TG=TC∪TL∪TR∪TA,其中TC、TL、TR和TA分别表示VC、VL、LR和LA中词项的集合;第2.2、对TC和TR中词项建立倒排索引,将词项直接映射至RDF标签图中节点;对TL和TA中词项建立两层关键字索引,将词项通过包含RDF标签图中位置信息的B树结构映射至RDF标签图中节点;定义4:一个RDF标签图G=(V,L,E)中节点为一个三元组n=(vC,lA,vL),其中:①.vC∈VC,lA∈LA,vL∈VL;②.存在边type(v,vC)∈E和lA(v,vL)∈E;③.满足以下条件:a)lA=null,vL=null当且仅当词项出现在vC中;b)lA≠null,vL=null当且仅当词项出现在lA中;c)lA≠null,vL≠null当且仅当词项出现在vL中;d)vC≠null;定义5:一个RDF标签图中节点n=(vC,lA,vL)的位置信息为vC;第3、利用关键字索引将用户输入的关键字映射至RDF标签图中节点,采用后向搜索算法在RDF模式图中寻找包含关键字的子图;第3.1、对用户输入的关键字进行预处理,生成关键字查询,定义6:一个关键字查询为一个序列q={w1,...,wn},其中wi为词项;第3.2、利用倒排索引将关键字查询中的部分词项映射至RDF标签图中类型节点,并将这些节点及其在RDF模式图中的邻近节点的集合作为该查询的位置信息;第3.3、利用两层关键字索引,结合查询的位置信息将关键字查询中的其余词项映射至RDF标签图中实体节点和文字节点;第3.4、采用后向搜索算法在RDF模式图中寻找包含关键字的子图;第4、基于子图与用户查询意图的相关度对结果进行计分排序,将得分较高的结果转化为SPARQL查询语句;第4.1、根据用户输入关键字的上下文关系,对结果子图中包含关键字的节点与用户查询意图的相关度进行计分,包含关键字的节点称为关键字节点;第4.2、结合子图中关键字节点的得分和子图的路径长度,对结果子图进行计分排序,定义7:关键字节点n与用户查询意图的相关度记作score(n),结果子图的路径长度记作PL,则结果子图与用户查询意图的相关度定义为:第4.3、将得分较高的结果子图转化为SPARQL查询语句。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711344360.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种防辐射的LED显示器
- 下一篇:一种笔记本上的电池组装设备