[发明专利]一种迭代的实体对齐模型有效

专利信息
申请号: 201710565742.2 申请日: 2017-07-12
公开(公告)号: CN107480191B 公开(公告)日: 2020-08-21
发明(设计)人: 刘知远;朱昊;谢若冰;孙茂松 申请(专利权)人: 清华大学
主分类号: G06F16/36 分类号: G06F16/36
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王庆龙;曹杰
地址: 100084 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实体 对齐 模型
【权利要求书】:

1.实体对齐方法,其特征在于,所述实体对齐方法应用于不同的单一领域或开放领域的知识库中,所述方法包括步骤:

分别获得第一知识图谱KG1中实体的向量表示和第二知识图谱KG2中实体的向量表示;所述知识库包含有客观世界上的一些有可区别性且独立存在的事物;所述事物至少包括人名和地名;所述第一知识图谱KG1中实体的向量为表示人名和地名的向量、所述第二知识图谱KG1中实体的向量也为表示人名和地名的向量;KGi=(Ei,Ri,Ti)其中Ei,Ri,Ti分别表示知识图谱中实体、关系、三元组的集合;

根据输入的对齐种子实体对集合,绑定第一知识图谱KG1和第二知识图谱KG2中表示相同含义的实体向量表示,获得第三知识图谱KG;

根据第三知识图谱KG、第一知识图谱KG1中实体的向量表示和第二知识图谱中实体的向量表示,迭代计算实体向量表示之间的相似度;在迭代计算过程中,若某一对实体向量表示的距离小于阈值,则将该对实体向量表示对应的实体对加入第三知识图谱KG,直至第三知识图谱KG的实体个数不再增加;

所述迭代计算实体向量表示之间的相似度,包括:

训练第一知识图谱KG1与第二知识图谱KG2之间的映射关系,直到评价函数L最小;其中:

L=K+I;

KT=∑(h,r,t)∈TL(h,r,t);

L(h,r,t)=∑(h′,r′,t′)∈T-[γ+E(h,r,t)-E(h′,r′,t′)]+

E(h,r,t)=||h+r-t||;

其中[x]+=max{0,x}表示0和x中的最大值,

T-

{(h′,r,t)|h′∈E1∪E2}∪{(h,r,t′)|t′∈T1∪T2}∪{(h,r′,t)|r′∈R},(h,r,t)∈KG1∪KG2};

R(e1,e2)=σ(k(θ-E(e1,e2)));

E(p,r)=|(|p-r|)|=|(|p-(t-h)|)|=E(h,p,t);

其中,H(ex,ey)函数表示将K函数中的每一项ex替换为ey之后的函数,第一知识图谱KG1=(E1,R,T1),第二知识图谱KG2=(E2,R,T2),第三知识图谱KG=(E,R,T);其中,E、E1、E2表示分别属于和KG、KG1和KG2实体集、R表示KG、KG1和KG2中的关系集;T、T1和T2表示分别属于KG、KG1和KG2的三元组的集合;e1∈E1,e2∈E2,e、h∈E1∪E2,r1、r2∈R,t∈T1∪T2,γ、θ、Z为超参数。

2.根据权利要求1所述的方法,其特征在于,所述迭代计算实体向量表示之间的相似度,包括:

通过随机梯度下降,最小化评价函数,对所有参数进行学习与更新。

3.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1或2所述方法的步骤。

4.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上执行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1或2所述方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710565742.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top