[发明专利]一种知识图谱实体对齐方法、系统、设备与存储介质在审
申请号: | 202210022610.6 | 申请日: | 2022-01-10 |
公开(公告)号: | CN114357193A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 徐童;陈恩红;陈力以;李徵;武晗 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/583;G06F40/284;G06F40/30;G06V10/40;G06V10/56;G06V10/82;G06N3/08 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 实体 对齐 方法 系统 设备 存储 介质 | ||
1.一种知识图谱实体对齐方法,其特征在于,包括:
训练阶段,通过多模态知识嵌入网络提取实体特征,其中:对于每一实体,从对应图像中提取相应的视觉特征,并基于视觉特征对预训练的BERT模型提取的属性特征进行视觉自适应处理,获得最终的属性特征,以及采用针对关系的视觉增强机制对图谱嵌入模型提取的关系特征进行视觉增强处理,获得最终的关系特征,再将视觉特征、最终的关系特征与最终的属性特征整合为整体的实体表征;并且,利用来自不同知识图谱的两个实体的单模态特征和整体的实体表征进行相似度对比学习,所述单模态特征包括:视觉特征、最终的关系特征与最终的属性特征;利用视觉增强处理时的损失函数与对比学习的损失函数构建总损失函数进行训练,更新多模态知识嵌入网络的参数;训练完毕后,利用训练后的多模态知识嵌入网络获得更新后的实体的整体的实体表征;
对于两个不同知识图谱中的实体,通过更新后的整体的实体表征,两两进行相似度计算,选择相似度最高的两个实体作为对齐实体。
2.根据权利要求1所述的一种知识图谱实体对齐方法,其特征在于,所述对于每一实体,从对应图像中提取相应的视觉特征包括:
对于实体e,利用残差网络模型从对应图像i中提取特征,并通过线性变换获得投影到对应空间,获得相应的视觉特征,表示为:
ie=ResNet(i)
eI=W1·ie+b1
其中,ResNet表示残差网络模型,ie表示残差网络模型从图像i中提取的特征,eI表示相应的视觉特征,W1与b1表示线性变换的权重与偏置参数。
3.根据权利要求1所述的一种知识图谱实体对齐方法,其特征在于,采用针对关系的视觉增强机制对图谱嵌入模型提取的关系特征进行视觉增强处理,获得最终的关系特征包括:
训练阶段,利用正负样本,结合图谱嵌入模型的损失函数以及视觉增强的损失函数优化图谱嵌入模型;其中,正样本是指三元关系组的关系正确,即头尾实体满足相应的关系r,负样本是指三元关系组关系不正确,即头尾实体不满足相应的关系r;正样本表示为(h,r,t),h与t分别为头实体与尾实体;负样本表示为(h′,r,t′),h′与t′分别为头实体与尾实体;
通过图谱嵌入模型提取正负样本中头实体与尾实体的实体嵌入向量,以及关系的嵌入向量,并带入图谱嵌入模型的损失函数进行计算;计算视觉增强的损失函数时,先通过残差网络与线性变换获得正负样本对应图像的视觉特征,再结合图谱嵌入模型提取的关系嵌入向量带入视觉增强的损失函数进行计算;
训练完毕后,通过图谱嵌入模型提取实体嵌入向量作为相应实体最终的关系特征。
4.根据权利要求3所述的一种知识图谱实体对齐方法,其特征在于,
图谱嵌入模型的损失函数数表示为:
其中,TR表示正样本集合,T′R表示负样本集合;(h,r,t)=τ,(h′,r,t′)=τ′,hR、h′R各自表示头实体h、头实体h′的实体嵌入向量,tR、t′R各自表示尾实体t、尾实体t′的实体嵌入向量,hr表示关系r的嵌入向量,实体嵌入向量与关系r的嵌入向量均为图谱嵌入模型的输出;Υr表示得分间隔,fr(.)表示得分函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210022610.6/1.html,转载请声明来源钻瓜专利网。