[发明专利]一种知识图谱关系补全方法在审
申请号: | 202111188118.8 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113918730A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 赵之晗;陈晓云;陆海;张少泉;张筱雨 | 申请(专利权)人: | 云南电网有限责任公司电力科学研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 650217 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 关系 方法 | ||
本申请提供一种知识图谱关系补全方法,包括将知识库文件输入到内部知识推理模块和外部知识推理模块;知识表示训练模块将知识库文件的实体和关系转换为相应的空间向量;三元组预测模块对空间向量中的三元组进行打分,根据打分结果确定推理得到的三元组的置信度;如果三元组成立,将三元组添加到第一三元组集合;外部知识推理模块基于统一表示学习框架将知识库文件的三元组和对应文本投影到同一向量表示空间;对同一向量表示空间中的向量按照预设满足关系进行调整并推断缺失关系,得到第二三元组集合;对第一三元组集合与第二三元组集合进行融合去重并添加到知识库文件,将知识库文件导入到预设数据库生成新的知识图谱对知识图谱进行补全。
技术领域
本申请涉及电力技术领域,尤其涉及一种知识图谱关系补全方法。
背景技术
近年来,随着大数据时代的到来,电力数据也开始呈爆炸式增长,数据量的增大使得仅靠人力难以快速高效的完成各种数据处理分析任务,因此利用计算机辅助人们处理分析数据是解决这一难题的必由之路。由于计算机无法直接处理人类语言构成的数据格式,所以需要寻求一种新的质量精良对计算机友好的知识表示方式,由此,知识图谱这一知识表示形式产生。
自从2012年,Google公司提出知识图谱这一知识表示形式,知识图谱就成为各行各业研究的重点,电力研究人员开始针对电力领域进行知识图谱的构建,但是在现有的知识图谱构建过程往往遵循“先数量再质量”的策略,即“先构建到一定规模,再提高质量”这样一种妥协的策略,因此自动构建而成的知识图谱不可避免地存在各种质量问题,尤其是知识缺失问题。初步构建完的知识图谱往往会因为所采用的知识源对知识的覆盖不全而缺失大量相关知识。
发明内容
本申请提供一种知识图谱关系补全方法,以解决电力领域知识图谱的关系缺失问题,提高电力领域知识图谱构建的质量。
一种知识图谱关系补全方法,包括:
获取待处理的知识图谱,将知识图谱输入知识图谱转换模块,知识图谱转换模块将知识图谱转换为三元组存储形式的知识库文件;
分别将知识库文件输入到知识图谱转换模块的内部知识推理模块和外部知识推理模块;
内部知识推理模块包括知识表示训练模块和三元组预测模块;知识表示训练模块对知识库文件进行训练,将知识库文件的实体和关系转换为相应的空间向量;三元组预测模块通过基于神经网络模型的打分函数对空间向量中的三元组进行打分,根据打分结果确定推理得到的三元组的置信度;
根据置信度结果,判断三元组是否成立,如果成立,将三元组添加到第一三元组集合;
外部知识推理模块基于统一表示学习框架将知识库文件的三元组和对应文本投影到同一向量表示空间;
对同一向量表示空间中的向量按照预设满足关系进行调整,以及根据调整后的向量推断缺失关系,得到第二三元组集合;
对第一三元组集合与第二三元组集合进行融合去重,得到第三三元组集合;
将第三三元组集合添加到知识库文件,并将知识库文件导入到预设数据库生成新的知识图谱,根据新的知识图谱对知识图谱进行补全。
进一步地,知识图谱转换模块利用Neo4j图数据库将知识图谱转换为三元组存储形式的RDF知识库文件。
进一步地,三元组包括头实体、关系及尾实体。
进一步地,三元组预测模块通过基于神经网络模型的打分函数对空间向量中的三元组进行打分,根据打分结果确定推理得到的三元组的置信度,包括:
基于神经网络模型输出的空间向量选取真实三元组的头实体和关系向量,计算尾实体的向量,获取推理排名为前n的尾实体及其打分分数,n>1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司电力科学研究院,未经云南电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111188118.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多个星敏感器的优先级变更方法及系统
- 下一篇:基于Web浏览器的打印控制方法