[发明专利]多元关系知识库构建方法和系统在审

专利信息
申请号: 202011019535.5 申请日: 2020-09-24
公开(公告)号: CN114328940A 公开(公告)日: 2022-04-12
发明(设计)人: 姚权铭 申请(专利权)人: 第四范式(北京)技术有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F17/16;G06K9/62
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 田方;苏银虹
地址: 100085 北京市海淀区清*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 多元 关系 知识库 构建 方法 系统
【说明书】:

公开了一种多元关系知识库构建方法和系统。所述方法包括:针对多元关系知识库中的多元组构建多元关系模型,并建立对应估分函数和损失函数;基于所述估分函数和损失函数,使用从所述多元关系知识库获得的训练样本对所述多元关系模型进行训练;基于经过训练的多元关系模型来预测并补全所述多元关系知识库中具有缺失实体的多元组中的缺失实体,并基于补全了缺失实体的各个多元组来构建完整的多元关系知识库。

技术领域

本申请涉及人工智能领域中的知识图谱技术,更具体地讲,涉及一种多元关系知识库构建方法和系统。

背景技术

随着信息网络技术的快速发展,各种信息网络数据内容呈现爆炸式增长的态势。这样的内容通常具有大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(KG,Knowledge Graph)是语义网络的知识库,能够用可视化技术描述知识资源及其载体,并挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

知识图谱作为一种特殊的图形结构,实体(entities)作为结点,关系(relations)作为有向边,最近引起了很多人的兴趣。在常见的知识图谱中,每个边缘被表示为具有(头部实体,关系,尾部实体)这一形式的三元组(s,r,o),以指示两个实体s(即,头部实体)和o(即,尾部实体)通过关系r连接,例如(NewYork,isLocatedIn,USA)可表示NewYork位于USA。在过去的几十年中建立了许多大型知识图谱,例如WordNet,Freebase,DBpedia,YAGO。它们改进了各种下游应用,例如结构化搜索、问答和实体推荐等。

然而,现有的知识图谱的处理方法通常限制在二维,例如(关系,实体1,实体2)这样的三个元素之间的三元关系,但是这样的表达有时很有局限性。例如,一般的购买行为可以是一个涉及购买者、物品和销售员的三元关系,但体育赛事奖项通常涉及运动员、队伍、奖项和赛季这样的四元关系。然而,大部分传统的知识图谱处理方法无法直接拓展到多元关系,对于多元关系知识库(KB,Knowledge Bases)建模,现有的方法不能提供具有足够表达能力且高效的建模方案。

此外,现有的工作大多关注于“关系”级别的建模,而忽视了多元关系中存在的“角色(role)”的作用。图1中示例性地示出了三个多元关系事实(即,与三元组(WasGovernorOf,California,Schwarzenegger)、四元组(PlayCharacterIn,Schwarzenegger,T-800,Terminator2:Judegment Day)、以及四元组(DirectorAwardFor,Terminator2:Judegment Day,JamesCameron,Saturn Award)对应的关系事实),每个关系基于其所属多元组的元数(arity)被表示为多个角色,每个角色表示该关系与对应实体之间的语义,并且不同的关系可共享相同的角色(例如,角色MOVIE在关系PlayCharacterIn和DirectorAwardFor之间被共享)。角色能够标识出关系的多种语义,这暗含了多元关系中的语义关联性。此外,关系与实体之间的交互被细化为角色与相关实体之间的基于角色的交互,这使得能够进一步确定多元关系事实的合理性。语义上相关的关系可共享相似的角色信息,因此可被表示为公共的共享角色。这样的角色能够从以下两个方面进一步确定多元关系事实的合理性:

首先,角色能够区分实体的多种语义。例如,如图1中所示,角色GOVERNOR和ACTOR能够清楚地标识出实体Schwarzenegger的political语义和star语义)。

其次,角色与相关实体具有各种交互模式,例如,如图1中所示,对于PlayCharacterIn,角色ACTOR和CHARACTER与它们对应的实体具有强交互。然而,由于知识库提供了与MOVIE和Schwarzenegger一起相关的丰富知识,因此与所关联的实体Terminator 2相比,角色MOVIE与Schwarzenegger具有更强的交互性和关联性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011019535.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top