[发明专利]基于强化学习的知识图谱实体化视图生成器及生成方法有效
申请号: | 202110318765.X | 申请日: | 2021-03-25 |
公开(公告)号: | CN112905806B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 王宏志;齐志鑫;张昊然 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06F40/279 |
代理公司: | 哈尔滨华夏松花江知识产权代理有限公司 23213 | 代理人: | 杨晓辉 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 知识 图谱 实体化 视图 生成器 生成 方法 | ||
基于强化学习的知识图谱实体化视图生成器及生成方法,属于计算机领域。本发明是为了解决现有知识图谱存储方案无法同时满足存储大规模知识图谱数据和高效处理复杂查询工作负载的要求。复杂子查询识别器对知识图谱查询语句中谓语进行识别,若谓语个数大于给定阈值数量,将数据库中含有所述谓语的语句形成语句集合;实体化视图在线生成模型采用Q学习算法判断是否对语句集合生成实体化视图,如果否,在数据库中完成查询语句集合操作,如果是,再次判断所述语句集合生成实体化视图后的存储量是否达到预算值,结果为否时,将语句集合构造成实体化视图;结果为是时,利用Q学习算法从语句集合中挑选出部分语句生成新的实体化视图。它用于提升查询效率。
技术领域
本发明涉及生成实体化视图的方法,属于计算机领域。
背景技术
近年来,随着知识图谱规模的日益扩大,其数据存储问题愈加重要。一方面,针对知识图谱体量大、查询语句结构复杂的特点,其存储结构不仅需要具备存储大规模数据的能力,还要能够高效处理结构复杂的查询工作负载;另一方面,知识图谱的查询工作负载(知识图谱的查询语句)更新速度快,其存储结构需要具备适应查询负载动态变化的能力。然而,现有的知识图谱存储方案无法很好地满足以上两个要求,基于关系模型的知识图谱存储方案能够存储大规模知识图谱数据,但当数据量超过一定范围时,结构复杂的查询语句会使关系数据库产生大量自连接操作,很大程度上降低了查询效率。以三元组表存储方案为例,当查询负载的选择性较大时,关系数据库会选择放弃索引而采用逐行扫描的方式完成查询操作,这使得查询延迟时间与图数据量大小成正比,当数据量大时,会造成巨大的时间开销。原生知识图谱存储方案能够较好地应对结构复杂的知识图谱查询工作负载,其查询操作代价与图数据量无关,仅与图的遍历范围成正比。但原生知识图谱存储方案不能存储规模过大的数据,以Neo4j存储方案为例,其社区版对于存储量设有上限,最大节点存储量是235,企业版没有上限但闭源不利于开发,这使得该存储方案无法存储完整的知识图谱。
由此可见,现有知识图谱存储方案无法同时满足存储大规模知识图谱数据和高效处理复杂查询工作负载的要求。此外,知识图谱往往根据数据库管理员(DBA)的经验来选择存储方案,其存储结构单一不具有灵活性,无法很好地适应变化的查询工作负载。因此,知识图谱的存储问题亟需新技术来解决。
发明内容
本发明的目的是为了解决现有知识图谱存储方案无法同时满足存储大规模知识图谱数据和高效处理复杂查询工作负载的要求,现提供基于强化学习的知识图谱实体化视图生成器及生成方法。
基于强化学习的知识图谱实体化视图生成器,所述生成器包括复杂子查询识别器和实体化视图生成模型;
复杂子查询识别器,用于对输入到数据库内的知识图谱查询语句中的谓语进行识别,若数据库中的所述谓语个数大于给定阈值数量,则将数据库中含有所述谓语的语句形成语句集合传给实体化视图在线生成模型;
实体化视图在线生成模型,用于采用Q学习算法判断是否对所述语句集合生成实体化视图,如果否,在数据库中完成查询语句集合的操作,如果是,再次判断所述语句集合生成实体化视图后的存储量是否达到预算值,结果为否时,将所述语句集合构造成实体化视图;结果为是时,利用Q学习算法从所述语句集合中挑选出部分语句生成新的实体化视图。
优选地,实体化视图在线生成模型,还用于计算实体化视图或者新的实体化视图的奖励值,用奖励值训练Q学习算法中的Q学习模型,当Q学习模型训练好之后,对输入的所述相同谓语自动生成实体化视图或者新的实体化视图。
优选地,实体化视图在线生成模型包括实体化视图判断单元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110318765.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:零售营销系统及方法
- 下一篇:一种网格织物增强水泥基复合材料及其制备方法