[发明专利]一种基于关键字上下文的SPARQL查询语句自动生成方法有效
申请号: | 201711344360.3 | 申请日: | 2017-12-15 |
公开(公告)号: | CN107992608B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 温延龙;靳宇东;袁晓洁 | 申请(专利权)人: | 南开大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键字 上下文 sparql 查询 语句 自动 生成 方法 | ||
一种基于关键字上下文的SPARQL查询语句自动生成方法,属于数据库技术应用领域。包括:采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;构建包含节点在RDF标签图中位置信息的两层关键字索引;利用关键字索引将用户输入的关键字映射至RDF标签图中节点,采用后向搜索算法在RDF模式图中寻找包含关键字的子图;最后基于子图与用户查询意图的相关度对结果进行计分排序,将得分较高的结果转化为SPARQL查询语句。本发明提出的SPARQL查询语句自动生成方法,能够根据关键字准p确、高效地生成符合用户查询意图的SPARQL查询语句,达到帮助用户快速查询信息的目的。
技术领域
本发明属于数据库技术领域,具体涉及一种新型的SPARQL查询语句自动生成技术。
背景技术
随着语义网技术的发展,各个领域采用RDF的形式描述知识,RDF数据成倍增长,海量的数据可供人们使用。SPARQL作为RDF数据的结构化查询语句,能够对RDF数据中的知识进行查询,并且借助数据库查询优化等策略取得较高的查询效率。然而,了解RDF数据模式和SPARQL语法是构造查询语句的基础,而且RDF数据的模式通常十分复杂,因此,构造SPARQL查询语句对于普通用户是非常困难的,导致人们无法便捷地从海量数据中获取知识,造成RDF数据无法为用户提供方便的知识服务。
可见,帮助用户构造SPARQL查询语句是便捷获取知识的基础。若能根据用户输入的关键字自动生成符合用户查询意图的SPARQL查询语句,将会减少用户在理解RDF数据模式和学习SPARQL语法上所耗费的时间和精力,进而有助于用户对数据的检索查询。
发明内容
本发明目的是解决用户无法直接参考RDF数据复杂模式完成SPARQL查询的问题,基于启发式算法,提出了一种基于关键字上下文的SPARQL查询语句自动生成方法。自动生成SPARQL查询语句,既可以满足普通用户快速且准确查询RDF数据获取知识的迫切需求,又能够为RDF数据提供各项知识服务奠定良好的基础。
本发明提供的基于关键字上下文的SPARQL查询语句自动生成方法的具体步骤如下:
第1、采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;
第1.1、将RDF数据映射为一个标签图,
定义1:RDF数据映射为一个标签图,用三元组G=(V,L,E)表示,其中:
①.V=VE∪VC∪VL为顶点集,VE表示实体节点集合,VC表示类型节点集合,VL表示文字节点集合;
②.L=LR∪LA∪{type,subClassOf}为边上标签集合,LR表示实体节点之间边的标签集合,LA表示连接实体节点和文字节点边的标签集合,type表示描述实体类型的标签,subClassOf表示描述类型层级关系的标签;
③.为边集合,其中v1和v2为V中的元素,e为L中的元素,表示由v1指向v2的标签为e的边,满足以下条件:
a)e∈LR当且仅当v1,v2∈VE,
b)e∈LA当且仅当v1∈VE,v2∈VL,
c)e=type当且仅当v1∈VE,v2∈VC,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711344360.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防辐射的LED显示器
- 下一篇:一种笔记本上的电池组装设备