[发明专利]迭代式实体关系抽取方法有效

专利信息
申请号: 201910546710.7 申请日: 2019-06-24
公开(公告)号: CN110275928B 公开(公告)日: 2022-11-22
发明(设计)人: 于兵;汪卫;陈雄;马柯;余荣贵 申请(专利权)人: 复旦大学;上海延华智能科技(集团)股份有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06F16/36
代理公司: 上海正旦专利代理有限公司 31200 代理人: 张磊
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种迭代式实体关系抽取方法,包括对迭代式实体关系抽取方法进行训练,以及使用训练好的模型对新的数据库中的实体关系进行抽取。本发明涉及到两个神经网络结构,一个是实体和关系抽取网络,另一个是异常实例发现网络,这两个网络结构是可以灵活改变的,在这网络中可以逐步添加一些新的数据特征,而不需要改变其他的结构。本发明人工确认非异常关系实例可以使用一种二分类分类器,这个过程不需要说明当前实例是否是某一种关系,只需要判断这个实例是否是一种关系就可以了,因此使用一个二分类的分类器可以避免人工干预。
搜索关键词: 迭代式 实体 关系 抽取 方法
【主权项】:
1.迭代式实体关系抽取方法,其特征在于具体步骤如下:(1):对迭代式实体关系抽取方法进行训练(1.1):从实体关系库中按时间倒序方式,分批次取出固定数量的实体关系集和与其对应的句子;将该句子编码为词向量的形式,将句子中的每个词语的词性、该词语与实体词之间的距离编码后连接到单词的词向量中,将编码后的结果输入到实体关系抽取模型中;所述实体关系抽取模型是一个可替换的神经网络模型,使用PCNN模型进行替代;在模型训练的过程中根据输入的词向量信息、位置信息和词性信息可以提取句子的语法和语义特征;(1.2):PCNN模型会提取句子中语法语义特征、词性特征和距离特征,根据输入的语法语义特征、词性特征和距离特征,利用神经网络模型的卷积神经网络输出一个包含以上特征的特征向量,使用该特征向量用来表示当前句子;(1.3):实体和关系的抽取过程就是从句子中抽取出包含实体和两个实体见关系的三元组信息,句子中包含的三元组信息可以表示为(实体1,关系,实体2)的形式;所有关系的类别编码成一个矩阵;将步骤(1.2)得到的表示当前句子的特征向量与关系中的类别信息组成的矩阵相乘输出一个向量,该向量就可以对当前句子中包含的实体间的关系的预测,预测后得到的关系是一个准关系,即完成实体关系抽取模型训练阶段;在实体关系抽取模型训练阶段,使用预测得到的关系和句子本身真实的关系对网络神经模型进行梯度下降优化;(1.4):在步骤(1.3)对实体关系抽取模型训练的时候,同时对异常关系检测模型进行训练,取非实体关系库中的实例查找是否包含异常关系实例,采用人工方式确认这些异常并系实例,如果是异常关系,不做任何处理,反之,剔除出异常数据集;将确认的异常关系实例放入异常实例检测网络中训练,异常实例网络训练也是一个神经网络,这个神经网络使用的双向LSTM后接全连接层和ReLu激活函数实现二分类,从而达到对异常关系检测模型的训练;(2):使用步骤(1)训练好的模型对新的数据库中的实体关系进行抽取(2.1):待抽取的实体关系抽取模型中的句子同样使用词向量模型对输入的句子进行词向量化,每个单词编码为词向量,同时将单词的词性特征编码为向量,每个词语与实体词之间的距离作为距离特征也编码为向量,将每个单词的这三个特征向量连接,组成句子的向量矩阵;(2.2):将步骤(2.1)得到的句子向量矩阵输入到实体关系抽取模型中,使用步骤(1)训练好的实体关系抽取模型提取输入向量矩阵的特征信息,最终的结果输出一个可以表征待抽取实体关系句子的向量;(2.3):使用步骤(2.2)得到的可以表征待抽取实体关系句子的向量与所有预定义关系编码的矩阵相乘,得到待预测句子在预定义关系下的表示;(2.4):使用softmax输出待抽取关系的句子在所有预定义关系编码下的概率,取概率值最大的关系作为抽取到的关系;(2.5):将步骤(2.4)中抽取到的关系作为异常关系检测模型中LSTM初始隐藏层的输入,将步骤(2.1)中得到的向量矩阵作为LSTM的输入,将这两部分输入输入到异常关系检测模型中对关系是否为合法的关系进行预测,在这个阶段得到的二分类的结果中两个分类结果的值相差越大越好,使用这个二分类结果的差值决定抽取到的关系是否是一个真正的合法的关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;上海延华智能科技(集团)股份有限公司,未经复旦大学;上海延华智能科技(集团)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910546710.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top