[发明专利]一种基于关键字上下文的SPARQL查询语句自动生成方法有效
申请号: | 201711344360.3 | 申请日: | 2017-12-15 |
公开(公告)号: | CN107992608B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 温延龙;靳宇东;袁晓洁 | 申请(专利权)人: | 南开大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键字 上下文 sparql 查询 语句 自动 生成 方法 | ||
1.一种基于关键字上下文的SPARQL查询语句自动生成方法,其特征在于该方法包括:
第1、采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;
第1.1、将RDF数据映射为一个标签图,
定义1:RDF数据映射为一个标签图,用三元组G=(V,L,E)表示,其中:
①.V=VE∪VC∪VL为顶点集,VE表示实体节点集合,VC表示类型节点集合,VL表示文字节点集合;
②.L=LR∪LA∪{type,subClassOf}为边上标签集合,LR表示实体节点之间边的标签集合,LA表示连接实体节点和文字节点边的标签集合,type表示描述实体类型的标签,subClassOf表示描述类型层级关系的标签;
③.为边集合,其中v1和v2为V中的元素,e为L中的元素,表示由v1指向v2的标签为e的边,满足以下条件:
a)e∈LR当且仅当v1,v2∈VE,
b)e∈LA当且仅当v1∈VE,v2∈VL,
c)e=type当且仅当v1∈VE,v2∈VC,
d)e=subClassOf当且仅当v1,v2∈VC;
第1.2、对RDF标签图进行模式摘要处理,生成RDF模式图,
定义2:一个RDF标签图G=(V,L,E)经过模式摘要处理生成一个RDF模式图,用三元组GS=(VS,LS,ES)表示,其中:
①.VS=VC,LS=LR∪{subClassOf},其中v1S和v2S为VS中的元素,eS为LS中的元素,表示由v1S指向v2S的标签为eS的边;
②.vS∈VS代表VE中所有vS类型的实体节点,即
③.当且仅当对于和存在
第2、构建包含节点在RDF标签图中位置信息的两层关键字索引;
第2.1、为RDF标签图建立词表,
定义3:一个RDF标签图G=(V,L,E)的词表为集合TG=TC∪TL∪TR∪TA,其中TC、TL、TR和TA分别表示VC、VL、LR和LA中词项的集合;
第2.2、对TC和TR中词项建立倒排索引,将词项直接映射至RDF标签图中节点;对TL和TA中词项建立两层关键字索引,将词项通过包含RDF标签图中位置信息的B树结构映射至RDF标签图中节点;
定义4:一个RDF标签图G=(V,L,E)中节点为一个三元组n=(vC,lA,vL),其中:
①.vC∈VC,lA∈LA,vL∈VL;
②.存在边type(v,vC)∈E和lA(v,vL)∈E;
③.满足以下条件:
a)lA=null,vL=null当且仅当词项出现在vC中;
b)lA≠null,vL=null当且仅当词项出现在lA中;
c)lA≠null,vL≠null当且仅当词项出现在vL中;
d)vC≠null;
定义5:一个RDF标签图中节点n=(vC,lA,vL)的位置信息为vC;
第3、利用关键字索引将用户输入的关键字映射至RDF标签图中节点,采用后向搜索算法在RDF模式图中寻找包含关键字的子图;
第3.1、对用户输入的关键字进行预处理,生成关键字查询,
定义6:一个关键字查询为一个序列q={w1,…,wi,...,wn},其中wi为词项;
第3.2、利用倒排索引将关键字查询中的部分词项映射至RDF标签图中类型节点,并将这些节点及其在RDF模式图中的邻近节点的集合作为该查询的位置信息;
第3.3、利用两层关键字索引,结合查询的位置信息将关键字查询中的其余词项映射至RDF标签图中实体节点和文字节点;
第3.4、采用后向搜索算法在RDF模式图中寻找包含关键字的子图;
第4、基于子图与用户查询意图的相关度对结果进行计分排序,将得分较高的结果转化为SPARQL查询语句;
第4.1、根据用户输入关键字的上下文关系,对结果子图中包含关键字的节点与用户查询意图的相关度进行计分,包含关键字的节点称为关键字节点;
第4.2、结合子图中关键字节点的得分和子图的路径长度,对结果子图进行计分排序,
定义7:关键字节点n与用户查询意图的相关度记作score(n),结果子图的路径长度记作PL,则结果子图与用户查询意图的相关度定义为:
第4.3、将得分较高的结果子图转化为SPARQL查询语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711344360.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防辐射的LED显示器
- 下一篇:一种笔记本上的电池组装设备