[发明专利]多元关系知识库构建方法和系统在审
申请号: | 202011019535.5 | 申请日: | 2020-09-24 |
公开(公告)号: | CN114328940A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 姚权铭 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F17/16;G06K9/62 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 田方;苏银虹 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多元 关系 知识库 构建 方法 系统 | ||
1.一种多元关系知识库构建方法,所述方法包括:
针对多元关系知识库中的多元组构建多元关系模型,并建立对应估分函数和损失函数,其中,所述多元关系知识库中的每个多元组由一个关系和多个实体构成,所述一个关系与所述多个实体中的每个实体之间的对应语义由角色来指示,并且所述一个关系的各个角色与所述多个实体中的对应实体之间的对应观测事实构成与该多元组对应的观测事实集合,其中,所述估分函数用于指示与每个多元组对应的观测事实集合中的角色与实体之间的关联性;
基于所述估分函数和损失函数,使用从所述多元关系知识库获得的训练样本对所述多元关系模型进行训练,其中,训练样本是与所述多元关系知识库中的不具有缺失实体的多元组对应的观测事实集合;
基于经过训练的多元关系模型来预测并补全所述多元关系知识库中具有缺失实体的多元组中的缺失实体,并基于补全了缺失实体的各个多元组来构建完整的多元关系知识库。
2.如权利要求1所述的方法,其中,建立估分函数的步骤包括:
建立包括预定数量的潜在角色基本向量的潜在角色空间,并基于所述潜在角色基本向量来确定每个角色的角色嵌入向量;
将每个实体映射到针对语义的预定数量的语义嵌入向量;
确定每个角色的角色敏感模式矩阵,其中,角色敏感模式矩阵指示该角色与各个实体的语义嵌入向量之间的交互强度;
基于角色嵌入向量、语义嵌入向量以及角色敏感模式矩阵来建立所述估分函数,
其中,每个角色的角色嵌入向量由所述潜在角色基本向量的组合来表示,并且
其中,每个角色的角色敏感模式矩阵是基于与所述潜在角色基本向量关联的基本矩阵建立的。
3.如权利要求2所述的方法,其中,所述估分函数被表示为:
其中,
且k′=1,2,...,K,
其中,
表示所述多元关系知识库中的元数为(ar+1)的多元组,r指示该多元组中的关系且r∈关系域ei指示该多元组中的第i个实体且ei∈实体域ε,是关系r的角色的集合,是与该多元组对应的观测事实集合,ar≥2且ar是正整数,
是关系r的第i个角色的嵌入向量,是角色的嵌入向量的对应角色权重矢量,指示由实体ei的m个语义嵌入向量构成的矩阵,是角色的角色敏感模式矩阵并且其第j行指示与所述多元组中的第j个实体ej的m个语义嵌入向量的交互强度,是潜在角色空间中的第k个潜在角色基本向量并且是与所述第k个潜在角色基本向量关联的基本矩阵,Φ是利用温度参数进行归一化的函数并且Tu是针对角色权重矢量的温度参数且TP是针对角色敏感模式矩阵的温度参数,
其中,d指示角色的嵌入向量维度,K是预设的潜在角色空间的大小并且指示潜在角色基本向量的数量,并且m是预定值。
4.如权利要求3所述的方法,其中,所述损失函数表示为:
其中,
表示针对正样本构建的ar组负样本的集合,φ是所述估分函数,表示实体域ε中与所述正样本中的实体ei不同的另一实体,表示替换正样本中的第q个实体所获得的负样本集合,1≤q≤ar且q为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011019535.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服装、肤色、发色比色卡
- 下一篇:一种沙棘汁及其制备方法