[发明专利]基于多粒度生成图像增强表示的隐式篇章关系识别方法有效
申请号: | 202010188895.1 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111488739B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 贺瑞芳;王建;贺迎春;郭凤羽;朱永凯 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘子文 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 粒度 生成 图像 增强 表示 篇章 关系 识别 方法 | ||
1.基于多粒度生成图像增强表示的隐式篇章关系识别方法,其特征在于,包括以下步骤:
(101)构建融合层:融合层内包括词嵌入模块、图像生成模块和文本-图像融合模块:1)词嵌入模块通过在嵌入空间中将篇章论元Arg1,Arg2的词向量序列表示逐一映射成两个篇章论元的向量表示,以捕捉篇章论元的上下文;2)图像生成模块通过文本到图像的生成神经网络生成篇章论元对应的图像,包括句子级别的论元图像生成和短语级别的论元图像生成,然后通过卷积神经网络CNN提取图像的特征,即图像的向量表示;3)文本-图像融合模块将篇章论元的向量表示和篇章论元对应的短语、句子图像的向量表示依次拼接后得到融合图文信息的篇章论元表示;
具体包括:1)词嵌入模块,给定论元对其中l1,l2分别是论元Arg1和Arg2的单词个数,分别是Arg1,Arg2中第i个和第j单词;将每个单词在预先训练的单词嵌入上进行查表操作获取对应的低维分布式向量表示后分别组成词向量序列表示即可获得篇章论元Arg1和Arg2的论元向量序列表示:Textrep1,Textrep2;2)图像生成模块,选择具有注意力生成对抗网络的细粒度文本到图像生成模型AttnGAN实现文本到图像的生成;AttnGAN的输入是论元的向量序列表示,输出的结果经过卷积神经网络CNN得到图像向量表示;具体来说,将两个论元和它们的短语分别输入AttnGAN,然后获得由卷积神经网络CNN产生的句子和短语图像向量表示:和其中分别表示Arg1中第k个短语的图像向量表示和Arg2中第l个短语的图像向量表示,pn,pm分别表示Arg1和Arg2中短语的个数,分别表示Arg1和Arg2的句子级图像向量表示;3)文本-图像融合模块,在获得论元向量表示Textrep1,Textrep2以及论元,论元短语的图像向量表示和后,根据图像向量表示生成的时间顺序依次与论元向量表示进行拼接得到融合图文信息的篇章论元表示:
(102)构建注意力控制层:通过双向长短期记忆神经网络BiLSTM学习包含图文信息的篇章论元的语义信息,并利用注意力机制捕获篇章论元中重要的词汇信息,将捕获到的重要词汇信息融入篇章论元的表示学习中,以加深对篇章论元的语义理解,从而获取融合重要图文信息的篇章论元表示;
(103)构建基于自注意力机制的图文交互层:在不同论元中的单词对判断两个论元间的篇章关系都有不同的重要信息,不同论元生成的图像信息也有着不同的交互信息;因此将两个来自步骤(102)的融合重要图文信息的篇章论元表示拼接成一个整体后输入到基于自注意力机制Self-attention mechanism的图文交互层能够捕获融合文本、图像的交互信息,从而捕获每个单词、图像内在的语义信息,以生成语义丰富的用于识别篇章关系的特征向量表示;
(104)构建篇章关系识别层:利用步骤(103)生成的用于识别篇章关系的特征向量表示对隐式篇章关系进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010188895.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序