[发明专利]基于张量分解的知识图谱嵌入方法、系统及设备有效
申请号: | 202010306913.1 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111680162B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 李勇;金德鹏;刘宇 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/16;G06F17/15 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张睿 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 张量 分解 知识 图谱 嵌入 方法 系统 设备 | ||
本发明实施例涉及知识图谱技术领域,公开了基于张量分解的知识图谱嵌入方法、系统及设备。本发明实施例先获取当前知识图谱对应的张量;对张量进行Tucker分解,以得到分解后的张量;确定与分解后的张量对应的事实得分;根据事实得分对与预设知识图谱嵌入模型对应的嵌入向量进行更新,通过更新后的嵌入向量进行当前知识图谱的嵌入操作。明显地,本发明实施例提供了一种较好的面向N元知识图谱的嵌入方式,具体地,将在知识图谱嵌入操作上结合进张量分解操作,最终可提高嵌入操作的准确性;同时,还大大降低了参数复杂度,提高了运行效率。而且,本实施例可基于Tucker和张量环式进行联合分解。
技术领域
本发明涉及知识图谱技术领域,尤其涉及基于张量分解的知识图谱嵌入方法、系统及设备。
背景技术
知识图谱(Knowledge Graph)是一种将现实世界中的事实以图谱的形式结构化表示和存储的数据格式,其中,事实包含的事物和概念对应着知识图谱中的实体,实体间的关系对应着知识图谱中的边。
目前,广泛研究的知识图谱集以2元关系为多,即将事实以三元组(r,h,t)进行描述,其中,h和t分别表示头实体和尾实体,r表示具体的2元关系。
然而,现实世界中实际上存在的更多的是多元关系,即多于2元的关系,例如,一个N元关系将对应着一个事实与N个实体之间的交互。
因此,N元关系对应的事实构成了更常见的知识表示和存储结构,即N元知识图谱(N-ary Knowledge Graph)。
但是,由于N元知识图谱并不完备,往往会存在着大量的事实缺失,需要根据现有的N元知识图谱信息推断缺失的实体间关系,即,需要进行N元知识图谱的补全操作。
就N元知识图谱的补全操作而言,目前已有的针对N元知识图谱的补全方式存在着诸多缺陷,比如,N元知识图谱中的关系属性表征较弱,且对于建模过程中出现的N元关系存在着较强的假设条件,只能表征一部分的N元关系,不适用于多样性的N元知识图谱的补全操作;同时,大部分的数据操作均局限于2元知识图谱这一维度,难以拓展到N元,普适性差,不能发掘出多元关系中的内在属性和规律。
可见,并不存在一类知识图谱的补全方式可以较好地适用于面向N元知识图谱的补全操作。
发明内容
为了解决上述技术问题,本发明实施例提供基于张量分解的知识图谱嵌入方法、系统及设备。
第一方面,本发明实施例提供一种基于张量分解的知识图谱嵌入方法,包括:
获取当前知识图谱对应的张量,其中,所述当前知识图谱为N元知识图谱,N为大于等于2的整数;
对所述张量进行Tucker分解,以得到分解后的张量;
确定与分解后的张量对应的事实得分;
根据所述事实得分对与预设知识图谱嵌入模型对应的嵌入向量进行更新,通过更新后的嵌入向量进行所述当前知识图谱的嵌入操作。
优选地,所述获取当前知识图谱对应的张量之后,所述基于张量分解的知识图谱嵌入方法还包括:
确定作为正样本集的所述张量中的目标正样本;
将所述目标正样本中的预设元实体替换为实体集中的实体样本,以得到负样本;
相应地,所述对所述张量进行Tucker分解,以得到分解后的张量,具体包括:
对所述正样本集与由所述负样本构成的负样本集进行Tucker分解,以得到分解后的张量。
优选地,所述对所述张量进行Tucker分解,以得到分解后的张量之前,所述基于张量分解的知识图谱嵌入方法还包括:
获取初始核张量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010306913.1/2.html,转载请声明来源钻瓜专利网。