[发明专利]基于置信度的知识表示学习方法在审
申请号: | 201810146689.7 | 申请日: | 2018-02-12 |
公开(公告)号: | CN110309310A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 刘知远;谢若冰;林芬;林乐宇 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识表示 三元组 置信度 图谱 能量方程 评价函数 构建 向量 学习 平移 关系向量 相似度 最小化 噪声 冲突 发现 | ||
1.一种知识表示学习方法,其特征在于,包括:
获取知识图谱中的三元组;
基于平移假设下的三元组不相似度公式和三元组置信度公式,构建能量方程;
根据所述能量方程构建基于边际的评价函数,通过最小化所述评价函数,学习实体向量和关系向量的表示。
2.根据权利要求1所述的知识表示学习方法,其特征在于,所述基于平移假设下的三元组不相似度公式和三元组置信度公式,构建能量方程,之前还包括:
确定平移假设下的三元组不相似度公式,确定三元组置信度公式。
3.根据权利要求1或2所述的方法,其特征在于,所述基于平移假设下的三元组不相似度的公式为:
E(h,r,t)=||h+r-t||
其中(h,r,t)为三元组的向量表达;E(h,r,t)为基于平移假设下的三元组不相似度;向量h为头实体,向量t为尾实体,向量r为两实体的关系。
4.根据权利要求1或2所述的方法,其特征在于,所述三元组置信度的公式为:
C(h,r,t)=λ1·LT(h,r,t)+λ2·PP(h,r,t)+λ3·AP(h,r,t)
其中,(h,r,t)为三元组的向量表达;C(h,r,t)为三元组置信度;LT(h,r,t)为局部三元组的置信度;PP(h,r,t)为先验路径置信度;AP(h,r,t)为自适应路径置信度;λ1,λ2,λ3是超参数,用于调整三种三元组置信度的权值;向量h为头实体,向量t为尾实体,向量r为两实体的关系。
5.根据权利要求4所述的方法,其特征在于,所述局部三元组的置信度的公式为:
其中α和β为超参数,α用于控制局部三元组置信度的下降幅度,β用于控制局部三元组置信度的上升幅度;Q(h,r,t)为三元组的质量;Q(h,r,t)的公式为:
Q(h,r,t)=-(γ+E(h,r,t)-E(h′,r′,t′)).
其中,γ为超参数,用于设置最大间隔算法的限制强度;E(h,r,t)为基于平移假设下的三元组不相似度;h’为替换h的负实例集合;r’为替换r的负实例集合;t’为替换t的负实例集合。
6.根据权利要求4所述的方法,其特征在于,所述先验路径置信度的公式为:
其中,QPP(r,pi)三元组在先验路径置信度下的质量函数;R(h,pi,t)表示路径pi在三元组上的路径的可信任度;S(h,t)为从头实体到尾实体的一定长度内的所有可能路径;
QPP(r,pi)的公式为:
其中,ε是超参数,用于;P(r,pi)是关系r和路径pi的共现概率;P(pi)是路径的pi的出现概率;
R(h,pi,t)的公式为:
其中,e是示例实体节点;Ei-1(·,e)是e的前置节点;Ei(e′,·)是e’的后继节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810146689.7/1.html,转载请声明来源钻瓜专利网。