[发明专利]基于生成对抗网络的关系抽取方法有效
申请号: | 201711063765.X | 申请日: | 2017-11-02 |
公开(公告)号: | CN107943784B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 刘兵;蒋方玲;蒋黎明;龚向坚 | 申请(专利权)人: | 南华大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06N5/02 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 421001 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 关系 抽取 方法 | ||
1.一种基于生成对抗网络的关系抽取方法,包括如下步骤:
S1.准备训练文本和待分析文本;所述训练文本中的实体和实体间的关系已经标注,待分析文本中的实体已经进行了标注;
S2.采用自然语言处理工具对训练文本和待分析文本进行分词和句法分析;
S3.采用图形绘制工具将步骤S2得到的分词和句法分析结果转换为句法分析树图像;
S4.采用步骤S3得到的训练文本的句法分析树图像和标注的文本中实体间的关系,对生成器和判别器进行相互竞争的迭代训练,从而得到训练好的生成对抗网络模型;
S5.采用步骤S4得到的生成对抗网络,输入步骤S3获取的待分析文本的句法分析树图像,对待分析文本进行关系抽取。
2.根据权利要求1所述的基于生成对抗网络的关系抽取方法,其特征在于步骤S2所述的自然语言处理工具为Stanford Parser或者具有类似功能的自然语言处理工具。
3.根据权利要求2所述的基于生成对抗网络的关系抽取方法,其特征在于步骤S3所述的图形绘制工具为Graphviz或者具有类似功能的图形绘制工具。
4.根据权利要求3所述的基于生成对抗网络的关系抽取方法,其特征在于步骤S4所述的对生成器和判别器进行相互竞争的迭代训练,具体为采用随机梯度下降法对生成器和判别器进行相互竞争的迭代训练。
5.根据权利要求4所述的基于生成对抗网络的关系抽取方法,其特征在于所述的采用随机梯度下降法对生成器和判别器进行相互竞争的迭代训练,具体为采用如下步骤进行训练:
A.生成m组训练文本及相应的句法分析树图像;
B.初始化判别器D和生成器G,并且每一次迭代中均包括依次判别器D的训练和生成器G的训练;
C.采用m个噪声向量和m个训练样本的句法分析树图像作为输入,采用如下公式计算梯度,并在判别器D的原有参数上增加计算得到的梯度更新判别器D的参数:
式中zi表示第i个噪声向量,xi表示第i个训练样本,Dy(xi)表示第i个训练样本判断为关系y的概率,实体间的关系的个数定义为Nr,yr表示第r种关系;Nr+1表示判别器的输入图像是生成器生成的假图像;Dyr(x)表示输入图像x中的实体间的关系是yr关系的概率;表示用于更新判别器D的梯度;
D.采用m个噪声向量作为输入,采用如下公式计算梯度,并在生成器G的原有参数上增加计算得到的梯度并更新生成器G的参数:
式中,表示用于更新生成器G的梯度;G(zi)表示第i个噪声向量经过G后生成的图像;zi表示第i个噪声向量;表示第i个噪声向量经过G后生成的图像中的实体间的关系是yr关系的概率;
E.以下式为目标函数,重复步骤C和D,直至训练完成,从而得到最终的训练模型:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南华大学,未经南华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711063765.X/1.html,转载请声明来源钻瓜专利网。