[发明专利]一种结合图注意力和属性聚类的实体对齐方法有效
申请号: | 202110777340.5 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113505239B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 包铁;朱蓓蓓;彭涛 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 注意力 属性 实体 对齐 方法 | ||
本发明公开了一种结合图注意力和属性聚类的实体对齐方法,包括:S1:将两个知识图谱的实体,输入到结合图注意力和密集连接的图卷积网络,得到实体嵌入表示;S2:基于所述实体嵌入表示,计算所述实体嵌入表示中实体间的相似性,得到序列s;S3:使用k‑prototype聚类方法对实体的属性进行混合聚类,并计算簇间的相异性,得到实体间的相异性;S4:根据预设阈值,利用所述实体间的相异性对所述序列s进行排序,得到候选集;S5:利用所述候选集过滤弱相关的实体,得到等价实体。本发明考虑多方面因素,并提高语义信息利用率,结合图注意力和属性聚类提升了两个知识图谱之间实体对齐的效率和精度。
技术领域
本发明属于自然语言处理技术领域,涉及一种结合图注意力和属性聚类的实体对齐方法。
背景技术
近年来,知识图谱被应用到无数领域。构建知识图谱的数据源可以是结构化数据、半结构化数据、无结构化数据和通用知识图谱等,但是不同组织会根据自己的业务需求去选择数据来源。此外构建不同领域知识图谱的方法也不具备统一的行业标准,这都导致了不同知识图谱间存在着异质和冗余问题。例如,图1显示了DBP15K数据集里面的中文知识图谱和英文知识图谱对实体“李宇春”的介绍存在互补和重复的情况,如果能够关联两个知识图谱的信息,会对李宇春这个人有更详细和更全面的认知。因此为了充分利用实体的信息,医学、电商和地理等领域的研究人员通过对齐的方式来融合不同的知识图谱。
但是现存的实体对齐方法首先没有很好的同时利用结构和属性信息。其次,没有很好地将节点特征之间的相关性融入到模型中。再次,没有采用有效的技术利用属性信息去过滤与测试源实体弱相关的等价实体集,这不利于实体对齐领域的发展。
由于实体对齐对于融合知识图谱非常关键,已经有研究人员对其进行研究。现有技术中北京大学王选计算机研究所的吴雨婷等人所做的联合学习实体和关系表示用于实体对齐,该技术方案显式地利用有价值的关系去辅助实体对齐,无需依赖预先对齐的关系种子去学习关系表示,而是利用图卷积神经网络学习到的实体嵌入去近似关系表示。该研究方法的步骤如下:首先利用普通的图卷积神经网络去嵌入各种知识图谱到向量空间以进行初步的实体对齐。然后,使用实体嵌入去近似可以被用于对齐跨知识图谱间关系的关系表示。最后,将实体嵌入和关系表示联合在一起,继续使用图卷积神经网络融合邻居的结构信息以获得更好的实体和关系表示。该研究方法有一定的局限性,不能利用注意力很好地将节点特征之间的相关性融入到模型中。另外,也没有利用实体的属性信息去辅助实体对齐。
通过对现有技术分析,发现现有技术主要存在的缺点包括:
(1)语义信息利用程度较低:仅仅嵌入结构和关系,没有考虑实体的属性信息对于实体对齐性能的影响。
(2)不能自动选择与实体对齐任务相关的子图:普通图卷积网络将各个邻居都视作具有相同的贡献度是不合理的,不能很好地将节点特征之间的相关性融入到模型中,效率较低。
(3)未考虑深度学习模型层数变多引起的梯度下降问题:现有的部分研究利用深度模型进行训练,但是在堆叠很多层神经网络的时候没有考虑噪声对模型性能的影响,不利于特征传播和模型的精度。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种至少部分解决上述技术问题的一种结合图注意力和属性聚类的实体对齐方法。
本发明实施例提供一种结合图注意力和属性聚类的实体对齐方法,包括:
S1:将两个知识图谱的实体,输入到结合图注意力和密集连接的图卷积网络,得到实体嵌入表示;
S2:基于所述实体嵌入表示,计算所述实体嵌入表示中实体间的相似性,得到序列s;
S3:使用k-prototype聚类方法对实体的属性进行混合聚类,并计算簇间的相异性,得到实体间的相异性;
S4:根据预设阈值,利用所述实体间的相异性对所述序列s进行排序,得到候选集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110777340.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于验证被测试模块的方法以及验证系统
- 下一篇:一种基于软瓷的外墙施工方法