[发明专利]基于注意力特征提取网络的社交网络图像描述生成方法在审
申请号: | 201910631320.X | 申请日: | 2019-07-12 |
公开(公告)号: | CN110473267A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 杜军平;薛哲;李金轩;周南 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及图像理解领域,提出了一种基于注意力特征提取网络的社交网络图像描述生成方法。该方法包括两个部分,基于注意力机制的图像特征提取网络:通过高层图像特征与语言模型上下文计算不同尺度图像的注意力关注区域;基于长短期记忆网络的语言生成模型:通过输入不同尺度的图像特征与前一层语言模型输出生成描述单词。创新性地在描述生成过程中将语言模型的上下文输出用于指导提取图像特征的关注区域,理论系统完备,创新性突出,主要用于对图像自动生成文本描述,在图像理解领域具有很高的实用价值。 | ||
搜索关键词: | 语言模型 关注区域 图像理解 注意力 提取图像特征 图像特征提取 上下文计算 注意力机制 尺度图像 创新性地 高层图像 记忆网络 理论系统 社交网络 生成模型 输出生成 特征提取 图像描述 图像特征 文本描述 自动生成 创新性 单词 网络 尺度 图像 输出 语言 | ||
【主权项】:
1.基于注意力特征提取网络的社交网络图像描述生成方法,其特征在于,将语言模型得到的上下文信息与图像的高层语义信息用于指导图像特征关注区域的提取。主要由基于注意力机制的卷积神经网络特征提取模块与多尺度语言模型的描述生成模块构成,通过将上下文信息用于图像特征提取,将两个模块由各自独立训练改进为融合训练,并在高分辨率与低分辨率图像数据集中均取得了较好的结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910631320.X/,转载请声明来源钻瓜专利网。