[发明专利]一种基于链路预测实现跨语言知识空间实体对齐方法及系统有效
申请号: | 201911396048.8 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111191462B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 李建欣;黄洪仁;李倩;宁元星;毛乾任 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/28;G06F16/36 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 预测 实现 语言 知识 空间 实体 对齐 方法 系统 | ||
1.一种基于链路预测实现跨语言知识空间实体对齐方法,其特征在于:包括:
步骤一:跨语言知识空间三元组融合,包括:在两个知识空间中通过三元组结构,即通过头实体和尾实体以及二者之间的关系三元定义知识空间,对齐种子实体对;生成新的跨知识空间三元组,通过所述新的跨知识空间三元组约束同一对实体之间的语义向量接近,将两个知识空间的实体的表示向量统一在同一个语义空间中;
步骤二:知识空间表示学习,通过ConvE模型来学习知识空间中实体与关系的表示;
步骤三:预测新对齐实体对;
步骤四:当存在预测出的一对新的对齐实体时,自学习添加新的训练数据,具体为:当存在预测出的一对新的对齐实体时,自学习方法将其视为新的标注对齐种子实体对数据,添加到旧的训练数据中进行训练,添加的过程中,如果新预测实体对和旧的训练数据产生冲突,那么舍弃新的预测实体对;如果新预测的实体对集合内部出现冲突,计算两个冲突的对齐实体对的概率差,选择概率值大的新预测实体队作为下一轮迭代的种子实体对;当自学习迭代次数超过设定的次数上限,停止迭代,训练对齐模型输出最终的跨语言实体对齐结果;
步骤五:输出最终预测结果。
2.根据权利要求1所述的一种基于链路预测实现跨语言知识空间实体对齐方法,其特征在于:所述跨语言知识空间三元组融合步骤中,将两个知识空间的实体的表示向量统一在同一个语义空间中的方法具体为:采用扩展知识空间三元组的方法,将两个现有知识空间融合为一个新的知识空间,那么所述新的知识空间的三元组集合包括所述现有知识空间的三元组以及融合后新增三元组集合,即通过已知对齐节点得到跨语言融合实体节点,进而融合两个实体空间。
3.根据权利要求2所述的一种基于链路预测实现跨语言知识空间实体对齐方法,其特征在于:所述通过ConvE模型来学习知识空间中实体与关系的表示过程具体为:经过初始化embedding后分别获得实体与关系的embedding,然后将它们重新调整形状大小成二维形式,之后堆叠起来;用特定个filter对堆叠后的矩阵进行卷积操作,生成一个特征矩阵;把特征矩阵重新调整形状大小成一个向量,然后用一个全连接其都射进一个特定维度空间;之后与目标实体的embedding相乘获得相应的分数;最后通过softmax打分函数获得具体分数;
上述过程的损失函数使用二元的交叉熵函数计算。
4.根据权利要求3所述的一种基于链路预测实现跨语言知识空间实体对齐方法,其特征在于:所述预测新对齐实体对步骤包括:
收集关于实体充当头实体或者尾实体的三元组集合,计算目标知识空间中实体和原知识空间中实体是同一个实体的概率;
计算阈值,计算原有训练数据集中种子对齐实体对是同一个实体的概率,算出它们的均值,将这个均值作为阈值;
选出目标空间中满足概率最大的实体,如果概率超过训练数据中计算的阈值,那么生成新的跨空间对齐实体对。
5.根据权利要求4所述的一种基于链路预测实现跨语言知识空间实体对齐方法,其特征在于:所述自学习添加新的训练数据四个部分组成步骤中所述次数上限为50。
6.根据权利要求5所述的一种基于链路预测实现跨语言知识空间实体对齐方法,其特征在于:所述输出最终预测结果步骤包括:
根据预测结果对两个知识空间进行合并,生成新的知识空间。
7.一种基于链路预测实现跨语言知识空间实体对齐系统,其特征在于:包括:
信息输入模块,用于两个不同的知识空间的数据库;
基于链路预测实现跨语言知识空间实体对齐模块,应用权利要求1-6中任一所述基于链路预测实现跨语言知识空间实体对齐方法,对输入知识空间数据进行合并;
信息输出模块,将自动生成的新的知识空间的数据进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911396048.8/1.html,转载请声明来源钻瓜专利网。