[发明专利]一种基于深度学习的关系抽取系统及其方法有效
申请号: | 201910732040.8 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110414008B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 马炀;李宏;汉斯·乌思克尔特;艾人龙 | 申请(专利权)人: | 深巨科技(北京)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06F16/36 |
代理公司: | 深圳国联专利代理事务所(特殊普通合伙) 44465 | 代理人: | 王天兴;彭冲 |
地址: | 100028 北京市朝阳区曙光西里*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 关系 抽取 系统 及其 方法 | ||
1.一种基于深度学习的关系抽取系统,包括用于关系抽取的终端,其特征在于,所述用于关系抽取的终端中包括关系类别分类模块和关系角色组合判别模块;
所述用于关系抽取的终端,还包括收集模块、嵌入模块、训练模块一、聚类模块、训练模块二、识别模块、替换模块、分类模块、生成模块、判别模块、输出模块一和输出模块二;
所述收集模块用于收集人工标注或基于传统模式识别标注的数据做为训练数据;
所述嵌入模块用于将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
所述训练模块一用于用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
所述聚类模块用于按照关系类别对训练数据进行聚类,对每一类关系:穷举生成所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
所述训练模块二用于对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二;
所述关系类别分类模块用于根据文本内容,由机器学习算法判断文本描述的关系的关系类别;
所述关系角色组合判别模块用于判别在已经识别关系的句子中,判断句子中命名实体在关系中承担的角色。
2.根据权利要求1所述的基于深度学习的关系抽取系统,其特征在于,所述识别模块用于对实时传入基于深度学习的关系抽取系统的文本,进行命名实体识别;所述替换模块用于将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;所述分类模块用于利用作为关系类别分类器的模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;所述生成模块用于根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;所述判别模块用于用对应的作为关系实体角色组合分类器的所述模型二进行判别得到最佳角色组合概率;所述输出模块一用于结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;所述输出模块二用于输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统的数据库中。
3.一种基于深度学习的关系抽取系统的方法,其特征在于,包括如下方式:
(1)开发训练,所述开发训练训练出对应的模型;
所述开发训练的具体方式,包括如下步骤:
步骤K-1:收集人工标注或基于传统模式识别标注的数据做为训练数据;
步骤K-2:将训练数据的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成句子向量化的矩阵;
步骤K-3:用生成的句子向量化的矩阵训练双向长短期记忆网络而得到模型一;
步骤K-4:按照关系类别对训练数据进行聚类,对每一类关系类别:穷举生成其所有可能的实体关系角色变换的组合,并把该组合作为模型二的训练数据;
步骤K-5:对每一种关系类别,用生成其所有可能的实体关系角色变换的组合来训练基于转换器的双向编码器网络而得到模型二;
(2)生产应用,运用所述开发训练出的模型来得到关系类别和关系角色组合;
所述生产应用的具体方式,包括如下步骤:
步骤L-1:对实时传入基于深度学习的关系抽取系统的文本,进行命名实体识别;
步骤L-2:将识别出来的实体部分替换成对应命名实体类别的标识,并对该标识进行词向量嵌入,生成作为预处理完的文本的句子向量化的矩阵;
步骤L-3:利用作为关系类别分类器的模型一,对预处理完的文本进行分类,获得概率排名最高的三种备选关系类别;
步骤L-4:根据三种备选关系类别中的每一种关系类别,生成其对应的穷举生成所有可能的实体关系角色变换组合;
步骤L-5:用对应的作为关系实体角色组合分类器的模型二进行判别得到最佳角色组合概率;
步骤L-6:结合概率排名最高的三种备选关系类别和最佳角色组合概率,输出最终系统判别的关系类别;
步骤L-7:输出文本中最佳角色组合概率对应的关系角色组合,并和最终系统判别的关系类别一起作为知识图谱存储于基于深度学习的关系抽取系统中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深巨科技(北京)有限公司,未经深巨科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910732040.8/1.html,转载请声明来源钻瓜专利网。