[发明专利]一种用于知识图谱中知识获取模型的构建方法及系统有效
申请号: | 201711394314.4 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108563653B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 刘知远;韩旭;孙茂松 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 知识 图谱 获取 模型 构建 方法 系统 | ||
1.一种用于知识图谱中知识获取模型的构建方法,其特征在于,包括:
S1,构建由多个句子为输入数据,以及每个句子内任意两个实体在知识图谱中的关系为分类结果,组成的第一训练集,用所述第一训练集对第一神经网络进行训练,并获得所述第一训练集的输入数据在所述第一神经网络中转化的向量;
每个句子至少包含2个实体;
S2,构建由多个知识图谱中的三元组组成的第二训练集,对第二神经网络进行训练,并获得所述第二训练集的输入数据在所述第二神经网络中转化的向量;
所述三元组中,头实体和尾实体为所述第二训练集的输入数据,所述头实体和尾实体在知识图谱中的关系作为第二训练集的分类结果;
S3,将所述第二训练集的输入数据在所述第二神经网络中转化的向量作为所述第一神经网络的注意力特征,对所述第一神经网络的训练结果进行加权,构建用于对句子中任意两个实体在知识图谱中关系分类的关系抽取模型;
S4,将所述第一训练集的输入数据在所述第一神经网络中转化的向量作为所述第二神经网络的注意力特征,对所述第二神经网络的训练结果进行加权,构建用于对任意两个实体进行知识图谱中关系分类的知识表示模型;
S5,将所述关系抽取模型和所述知识表示模型融合,获得用于知识图谱中知识获取的模型;
其中,所述注意力特征用来突出重要句子并减少噪音成分。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中用所述第一训练集对第一神经网络进行训练具体包括:
S11,将所述第一训练集中的句子输入到第一神经网络中,对所述第一训练集中句子包含的任意两个实体构建词向量序列,所述词向量序列包括词义向量和位置向量的拼接信息;
S12,通过卷积操作,池化操作和非线性操作将所述词向量序列转化为句子的向量表达;
S13,将所述句子的向量表达与所述知识图谱中的关系进行分类。
3.根据权利要求2所述的方法,其特征在于,所述卷积操作、池化操作和非线性操作具体为:
将所述词向量序列在卷积层和池化层中,通过滑窗的方式分解为多个局部特征;
在每个所述局部特征根据非线性操作,选取信号最强的值进行汇总,获得所述句子的向量表达。
4.根据权利要求3所述的方法,其特征在于,所述局部特征定义为:
hi=[Wxi-m+1:i+b]i
式中,hi表示在句子中第i个窗口中的特征向量,xi-m+1:i为第i个窗口内部的所有的词向量的拼接,W为卷积核矩阵,b为偏置向量,m为卷积窗口尺寸大小。
5.根据权利要求4所述的方法,其特征在于,所述在每个所述局部特征上选取信号最强的值进行汇总定义为:
式中,[y]j为在第j维度下选取信号最强值的汇总向量,hi表示在句子中第i个窗口中的特征向量。
6.根据权利要求1所述的方法,其特征在于,所述步骤S3中将所述第二训练集的输入数据在所述第二神经网络中转化的向量作为所述第一神经网络的注意力特征,对所述第一神经网络的训练结果进行加权具体包括:
将所述第二训练集中三元组内的头实体和尾实体在第二神经网络中作为输入数据,通过所述第二神经网络的图谱表示层,将所述输入数据转化为所述头实体和所述尾实体组合的向量;
将所述头实体和所述尾实体组合的向量与所述第一神经网络中句子的向量表达的空间距离作为所述第一神经网络中的注意力特征,根据所述第一神经网络的注意力特征,对所述第一训练集中包含与所述注意力特征对应的头实体和尾实体的句子进行权重叠加。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711394314.4/1.html,转载请声明来源钻瓜专利网。