[发明专利]一种知识图谱关系补全方法在审
申请号: | 202111188118.8 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113918730A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 赵之晗;陈晓云;陆海;张少泉;张筱雨 | 申请(专利权)人: | 云南电网有限责任公司电力科学研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 650217 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 关系 方法 | ||
1.一种知识图谱关系补全方法,其特征在于,包括:
获取待处理的知识图谱,将所述知识图谱输入知识图谱转换模块,所述知识图谱转换模块将所述知识图谱转换为三元组存储形式的知识库文件;
分别将所述知识库文件输入到所述知识图谱转换模块的内部知识推理模块和外部知识推理模块;
所述内部知识推理模块包括知识表示训练模块和三元组预测模块;所述知识表示训练模块对所述知识库文件进行训练,将所述知识库文件的实体和关系转换为相应的空间向量;所述三元组预测模块通过基于神经网络模型的打分函数对所述空间向量中的三元组进行打分,根据打分结果确定推理得到的所述三元组的置信度;
根据置信度结果,判断所述三元组是否成立,如果成立,将所述三元组添加到第一三元组集合;
所述外部知识推理模块基于统一表示学习框架将所述知识库文件的三元组和对应文本投影到同一向量表示空间;
对所述同一向量表示空间中的向量按照预设满足关系进行调整,以及根据调整后的向量推断缺失关系,得到第二三元组集合;
对所述第一三元组集合与所述第二三元组集合进行融合去重,得到第三三元组集合;
将所述第三三元组集合添加到所述知识库文件,并将所述知识库文件导入到预设数据库生成新的知识图谱,根据新的所述知识图谱对所述知识图谱进行补全。
2.根据权利要求1所述的知识图谱关系补全方法,其特征在于,所述知识图谱转换模块利用Neo4j图数据库将所述知识图谱转换为三元组存储形式的RDF知识库文件。
3.根据权利要求1所述的知识图谱关系补全方法,其特征在于,所述三元组包括头实体、关系及尾实体。
4.根据权利要求3所述的知识图谱关系补全方法,其特征在于,所述三元组预测模块通过基于神经网络模型的打分函数对所述空间向量中的三元组进行打分,根据打分结果确定推理得到的所述三元组的置信度,包括:
基于神经网络模型输出的空间向量选取真实三元组的头实体和关系向量,计算尾实体的向量,获取推理排名为前n的尾实体及其打分分数,n>1;
选取三元组的尾实体和关系向量,计算头实体的向量,获取推理排名为前n的头实体及其打分分数,n>1;
根据尾实体及头实体的打分分数,推理得到所述三元组的置信度。
5.根据权利要求4所述的知识图谱关系补全方法,其特征在于,将所述三元组添加到第一三元组集合,包括:
取置信度排名为前n的三元组补充头实体或尾实体之间的关系;
将生成的关系添加到第一三元组集合。
6.根据权利要求1所述的知识图谱关系补全方法,其特征在于,所述知识表示训练模块对所述知识库文件进行训练,包括:
将所述知识库文件中存在真实关系的三元组数据作为模型训练输入的正例;
知识表示训练模块利用对抗生成神经网络随机生成的非真实关系的三元组数据作为模型训练输入的负例;
将所述正例与所述负例输入到所述知识表示训练模块进行训练。
7.根据权利要求6所述的知识图谱关系补全方法,其特征在于,还包括;
如果所述知识表示训练模块输出的正例三元组和负例三元组的边际损失小于预设的阈值,则对所述知识库文件停止训练。
8.根据权利要求6所述的知识图谱关系补全方法,其特征在于,还包括:
在对所述知识库文件进行训练时,根据知识表示训练模块训练输出的结果和正例、负例标签来计算误差,利用误差反向传播算法来更新模型的梯度参数进行模型优化。
9.根据权利要求1所述的知识图谱关系补全方法,其特征在于,还包括:抽取所述知识库文件中的实体,根据所有抽取出的实体构建实体候选集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司电力科学研究院,未经云南电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111188118.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多个星敏感器的优先级变更方法及系统
- 下一篇:基于Web浏览器的打印控制方法