[发明专利]一种基于路径置信度的知识图谱噪声检测方法有效
申请号: | 202111393836.9 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114077676B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 马江涛;周辰宇;王艳军;李端阳;贾泽臣;马宇科;李霆;卢威光;张蓓蕾;李清扬;赵一帆 | 申请(专利权)人: | 郑州轻工业大学;河南图谱信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/16;G06N3/04;G06N3/08 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 栗改 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 路径 置信 知识 图谱 噪声 检测 方法 | ||
1.一种基于路径置信度的知识图谱噪声检测方法,其特征在于,其步骤如下:
步骤一:初始化三元组的数量,找到所有三元组的所有路径,利用翻译模型TransE算法对每一条路径的每一个三元组进行嵌入化表示,将三元组的全部路径表示为路径嵌入序列;其中,路径嵌入序列中相邻的三元组之间形成一个节点,节点数量为n;
步骤二:将节点依次输入至基于置信度的基于相关度的概率逻辑层(CPLL),计算每条路径中每个节点的置信度得分矩阵;
在步骤二中,具体方法为:
S21、对输入的节点T进行初始化:
其中,N′i表示路径上第i个三元组的嵌入矩阵,N′i+1表示路径上第i+1个三元组的嵌入矩阵,(N′i+1)T表示三元组嵌入矩阵N′i+1的转置,x′i、x′i+1、x′i+2均表示实体,r′i和r′i+1均表示关系;
S22、将节点T与参数矩阵W0相乘得到三元组之间的全局置信度,即全局三元组置信度:
GTT(i,i+1)=T·W0 (4);
其中,GTT(i,i+1)为全局三元组置信度;
S23、节点T进入Separatepadd layer中,分离出T的对角线上的子矩阵块T1,T2,T3,然后将T1,T2,T3分别与参数矩阵W1,W2,W3相乘,得到D,E,F;利用D,E,F进行基于相关度的逻辑运算并相加得到三元组之间的局部置信度,即局部三元组置信度:
D=T1·W1,E=T2·W2,F=T3·W3 (6);
其中,MIN(·)表示取矩阵的最小值,MAX(·)表示取矩阵的最大值,1表示矩阵内元素全为1,-1表示矩阵内的元素全为-1,分别表示不同的逻辑运算,LTT(i,j)为局部三元组置信度;
S24、将全局三元组置信度和局部三元组置信度相乘,得到节点T的置信度得分Gi:
Gi=GTT(i,i+1)·LTT(i,i+1) (12);
步骤三:分别将每个路径中的所有节点的置信度得分矩阵输入到Bi-GRU中,获得每个路径的得分矩阵;
步骤四:将每个路径的得分矩阵的L2范数作为路径置信度,并将路径置信度最高时对应的得分矩阵作为三元组的最优嵌入矩阵。
2.根据权利要求1所述的基于路径置信度的知识图谱噪声检测方法,其特征在于,在步骤三中,具体方法为:
S31、选择将每个节点的置信度得分Gi以及邻近节点的置信度Gi+1、Gi-1作为双向GRU的输入,第i个前向GRU和后向GRU的计算方式分别如下:
其中,表示前向GRU的输出结果,表示后向GRU的输出结果,GRU(·)表示门控循环网络;
S32、对前向GRU和后向GRU的最终输出进行连接、线性和归一化操作,得到路径的得分矩阵:
其中,h(p)表示门控循环网络的输出结果,即路径得分矩阵,表示前向GRU的最终输出结果,表示后向GRU的最终输出结果,concat()表示连接函数,linear()表示线性函数,softmax()表示归一化函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学;河南图谱信息科技有限公司,未经郑州轻工业大学;河南图谱信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111393836.9/1.html,转载请声明来源钻瓜专利网。