[发明专利]基于知识库内头尾实体分布的关系相似度度量方法及系统有效
申请号: | 201910639564.2 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110472233B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 刘知远;陈暐泽;朱昊;韩旭;孙茂松 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/36;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 马英迪 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 库内 头尾 实体 分布 关系 相似 度量 方法 系统 | ||
1.一种关系相似度度量方法,其特征在于,包括:
获取待比较的两个关系;
获取所述两个关系各自对应的头尾实体分布;
计算两个关系各自对应的头尾实体分布之间的KL散度,基于计算得到的KL散度确定所述两个关系间的相似度;
其中,所述计算两个关系各自对应的头尾实体分布之间的KL散度的步骤,进一步包括:
基于蒙特卡罗模拟,计算两个关系各自对应的头尾实体分布之间的KL散度;
所述基于蒙特卡罗模拟,计算两个关系各自对应的头尾实体分布之间的KL散度的步骤,进一步包括:
基于下式计算两个头尾实体分布之间的KL散度:
其中DKL(·||·)代表KL散度;代表关系r1对应的头尾实体分布,代表关系r2对应的头尾实体分布;h和t分别为关系对应三元关系组内的头实体和尾实体;θ*为模型参数;是从中采样出来的头尾实体对集合;
所述θ*满足如下条件:
其中是一个关系三元组的集合,ε为实体的集合,为关系的集合;θ为优化前的参数模型。
2.根据权利要求1所述的关系相似度度量方法,其特征在于,所述获取待比较的两个关系的步骤,之前还包括:
定义三元关系组的分布,定义三元关系组分布的计算方式。
3.根据权利要求2所述的关系相似度度量方法,其特征在于,所述定义三元关系组的分布,定义三元关系组分布的计算方式的步骤,之后还包括:
计算优化模型参数,基于所述优化模型参数对三元关系组的分布进行优化。
4.一种关系相似度度量系统,其特征在于,包括:
获取模块,用于获取待比较的两个关系;
获取模块,还用于获取所述两个关系各自对应的头尾实体分布;
计算模块,用于计算两个关系各自对应的头尾实体分布之间的KL散度,基于计算得到的KL散度确定两个关系间的相似度;
其中,所述计算模块,进一步用于:
基于蒙特卡罗模拟,计算两个关系各自对应的头尾实体分布之间的KL散度;
所述基于蒙特卡罗模拟,计算两个关系各自对应的头尾实体分布之间的KL散度的步骤,进一步包括:
基于下式计算两个头尾实体分布之间的KL散度:
其中DKL(·||·)代表KL散度;代表关系r1对应的头尾实体分布,代表关系r2对应的头尾实体分布;h和t分别为关系对应三元关系组内的头实体和尾实体;θ*为模型参数;是从中采样出来的头尾实体对集合;
所述θ*满足如下条件:
其中是一个关系三元组的集合,ε为实体的集合,为关系的集合;θ为优化前的参数模型。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一项所述关系相似度度量方法的步骤。
6.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至3任一项所述关系相似度度量方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910639564.2/1.html,转载请声明来源钻瓜专利网。