[发明专利]一种用于知识图谱融合的实体相似度计算方法有效
申请号: | 202010925569.4 | 申请日: | 2020-09-07 |
公开(公告)号: | CN111813962B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 李瑞瑞;李爽;唐泳 | 申请(专利权)人: | 北京富通东方科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 知识 图谱 融合 实体 相似 计算方法 | ||
1.一种用于知识图谱融合的实体相似度计算方法,其特征在于,包括:
获取待融合的两个知识图谱的数据;
计算实体的莱文斯坦比得分score1;
使用知识表示学习模型得到实体的向量表示,计算实体的节点距离得分score2;
计算实体的关系相似得分score3;
对实体的莱文斯坦比得分、节点距离得分和关系相似得分进行融合,得到最终的实体相似度得分scoretotal,计算公式如下:
所述两个知识图谱表示为G1=(E1,R1,T1)和G2=(E2,R2,T2),其中E1、E2分别为两个知识图谱的实体集,R1、R2分别为两个知识图谱的关系集,T1、T2分别为两个知识图谱的三元组集;三元组的结构:实体-关系-实体,三元组中的第一个实体记为头实体,第二个实体记为尾实体;
其中,α,β,γ∈(0,1),α+β+γ=1;
所述计算实体的关系相似得分score3,包括:
根据实体类别的关联性,划定每一类实体关系节点考虑的其他类别实体;
采用one-hot编码获取实体的关系向量;
采用余弦相似度计算实体的关系相似得分;
所述划定每一类实体关系节点考虑的其他类别实体,包括:药品类实体的关系节点关联疾病类实体;症状类实体的关系节点关联疾病、药品类实体;疾病类实体的关系节点关联症状、检查、科室以及药品类实体;检查类实体的关系节点考虑疾病类实体。
2.如权利要求1所述的一种用于知识图谱融合的实体相似度计算方法,其特征在于,所述使用知识表示学习模型得到实体的向量表示,计算实体的节点距离得分score2,包括:
使用训练好的知识表示学习模型得到实体的向量表示;
采用余弦相似度计算实体对应的向量表示的节点距离得分score2。
3.如权利要求2所述的一种用于知识图谱融合的实体相似度计算方法,其特征在于,所述使用训练好的知识表示学习模型得到实体的向量表示,包括:
在预训练模型基础上,利用自有医学语料进行微调,得到医学模型;
使用医学模型将知识图谱中所有的三元组初始化成向量形式的三元组(h,r,t);
利用TransE算法对向量形式的三元组(h,r,t)进行训练,得到能够计算实体间的语义相似性的三元组向量表示;
其中,h为三元组中的第一个实体,也称为头实体;
t为三元组中的第二个实体,也称为尾实体;
r为三元组中实体之间的关系。
4.如权利要求3所述的一种用于知识图谱融合的实体相似度计算方法,其特征在于,所述利用TransE算法对三元组(h,r,t)进行训练,为利用优化算法最优化损失函数值,使得优化目标函数值最小,以学得实体与关系的最佳向量表示,达到优化目标,损失函数如下:
其中,S表示正样本集合,S'表示负样本集合;
S'={(h',r,t)|h'∈h∪t}∪{(h,r,t')|t'∈h∪t};
γ表示正负样本之间的间距,是一个常数;
d(h,r,t)=||h+r-t||;
[x]+表示max(0,x);
约束条件:‖h‖≤1,‖r‖≤1,‖t‖≤1。
5.如权利要求4所述的一种用于知识图谱融合的实体相似度计算方法,其特征在于,所述负样本集合S',通过如下方式得到:
采用k近邻的方式,为三元组(h,r,t)的头实体h选取k个头实体作为头实体候选集,为三元组中的尾实体t选取k个尾实体作为尾实体候选集;
从头实体候选集随机选择一个头实体h',替换三元组中的头实体h得到负样本(h',r,t)并将负样本(h',r,t)添加到负样本集合S’;
从尾实体候选集随机选择一个尾实体t'替换三元组中的尾实体h得到负样本(h,r,t')并将负样本(h',r,t)添加到负样本集合S';
其中,挑选比例θ∈[0,1],N是知识图谱的总实体个数,是向上取整函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京富通东方科技有限公司,未经北京富通东方科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010925569.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低温推进剂排放处理装置
- 下一篇:一种乙醛脱氢酶的生产方法、组合物及制剂