[发明专利]基于多方面子任务交互的跨语言实体对齐方法在审
申请号: | 202210598738.7 | 申请日: | 2022-05-30 |
公开(公告)号: | CN114969367A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 刘爽;徐漫;孟佳娜;左莉;于玉海 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/284;G06F40/30;G06F40/40;G06N3/04;G06N3/08 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 马庆朝 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多方 面子 任务 交互 语言 实体 对齐 方法 | ||
1.一种基于多方面子任务交互的跨语言实体对齐方法,其特征在于,步骤如下:
步骤1:输入两个不同的知识图谱,获取基于BERT实体名称的词向量;
步骤2:通过以预先对齐的种子对为两个知识图谱之间的实体进行链接,以发现两个知识图谱中潜在的等效实体对;
步骤3:将两个知识图谱投影映射到同一个向量空间中;
步骤4:对于知识图谱的关系三元组和属性三元组进行学习,分别从实体的结构信息、关系信息、属性信息三个方面进行嵌入表示的学习;
步骤5:对结构信息进行初始实体对齐子任务;
步骤6:对关系信息进行关系对齐子任务;
步骤7:对属性信息进行属性感知的实体对齐子任务;
步骤8:对初始实体对齐和属性感知的实体对齐进行积极交互;
步骤9:对初始实体对齐第一交互结束后,与关系感知的实体对齐进行第二交互,以此类推进行若干次积极交互,不断更新优化向量表示,得到最终的实体向量表示;
步骤10:通过实体最终的向量表示进行最后的实体匹配,得到对齐结果;
步骤11:将对齐结果作为训练集数据,再次送入实体对齐的过程中,实现迭代策略。
2.如权利要求1所述的基于多方面子任务交互的跨语言实体对齐方法,其特征在于,针对步骤1,使用BERT模型对实体名称进行预训练得到相应的词向量表示,基于实体名称的词向量作为后续实体嵌入表示学习中的输入向量。
3.如权利要求2所述的基于多方面子任务交互的跨语言实体对齐方法,其特征在于,针对步骤2,预先对齐的实体种子对作为最初的训练集进入模型中;面对两个不同的知识图谱,种子对中的两个实体分别属于两个不同的知识图谱。
4.如权利要求3所述的基于多方面子任务交互的跨语言实体对齐方法,其特征在于,针对步骤3,实体模对齐型中的嵌入方式为直接将不同的知识图谱嵌入到同一个向量空间当中,潜在的实体对得到一个近似的表示。
5.如权利要求4所述的基于多方面子任务交互的跨语言实体对齐方法,其特征在于,针对步骤4,对于实体的三个不同方面的信息使用不同的嵌入表示学习方式:
对于实体的结构信息,使用图卷积神经网络层、注意力机制层和高速公路门控机制,对实体的邻域结构进行学习,对于相邻实体于中心实体的不同重要性进行加权,得到第一种条件下的实体嵌入向量表示;
对于实体的关系信息,使用到第一条件下得到的实体向量表示,关系三元组是由头实体、关系、尾实体组成,关系嵌入向量表示由头实体和尾实体通过相应计算来近似得到,为第二条件下得到的关系嵌入向量表示;
对于实体的属性信息,利用到属性三元组,包括实体、属性、属性值三个部分,其中属性值分为字符串和数字;对于不同类型的属性值使用不同的方法进行学习,最后进行向量聚合,成为第三种条件下的属性嵌入向量表示,其中不同的属性对于中心实体的重要程度不同,使用注意力进行加权融合。
6.如权利要求5所述的基于多方面子任务交互的跨语言实体对齐方法,其特征在于,针对步骤5,将得到的第一条件下的实体嵌入向量表示进行初始实体对齐,判断是否匹配的条件是两个实体向量在统一空间中的距离:距离越近,则为等价实体的可能性越大;距离越远,则为等价实体的可能性越大小。
7.如权利要求6所述的基于多方面子任务交互的跨语言实体对齐方法,其特征在于,针对步骤6,将步骤4中得到的第二条件下的关系嵌入向量表示,进行实体关系感知匹配,计算关系向量距离;头实体和尾实体在其关联的三元组中对齐的实体对越多,这两个关系具有相同含义的可能性越大。
8.如权利要求7所述的基于多方面子任务交互的跨语言实体对齐方法,其特征在于,针对步骤7,将步骤4中得到的第三条件下的属性嵌入向量表示,进行基于属性的实体对齐;基于假设两个等价的实体共享或拥有相似的属性和值,对于两种类型的属性值分别得出的向量表示,分别计算向量距离,最后采用平均的方法将两个通道进行集成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210598738.7/1.html,转载请声明来源钻瓜专利网。