[发明专利]一种基于联合神经网络模型的图像内容描述自动生成方法有效

专利信息
申请号: 201910453505.6 申请日: 2019-05-28
公开(公告)号: CN110188775B 公开(公告)日: 2020-06-26
发明(设计)人: 张应福;陆文斌;周正斌;钟凯;张腾飞;花福军 申请(专利权)人: 创意信息技术股份有限公司
主分类号: G06K9/46 分类号: G06K9/46;G06K9/62;G06N3/04
代理公司: 成都金英专利代理事务所(普通合伙) 51218 代理人: 袁英
地址: 610000 四川省成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 联合 神经网络 模型 图像 内容 描述 自动 生成 方法
【权利要求书】:

1.一种基于联合神经网络模型的图像内容描述自动生成方法,其特征在于,包括如下步骤:

S1:构建卷积神经网络与循环神经网络的联合神经网络;

S2:利用误差反向传播算法对联合神经网络多层映射参数进行训练;

所述步骤S2还包括如下子步骤:

S21:先行预训练LSTM部分的网络,进行模型稳定性训练;

S22:利用数据集Flickr30k对整体模型进行训练,完成联合神经网络中的特征映射;

S23:训练步骤S21和S22中的形成的稳定效果的模型,最终完成联合神经网络的训练;

所述步骤S22还包括如下子步骤:

S221:对每层输入数据进行标准化,使其以较小的方差集中在均值附近,需要满足:

其中,μB是输入数据的均值;是输入数据的方差;x是最小batch中的值,其中B是一个最小批,m是B的尺寸,即B={x1······xm},同时在正向传播的时候对数据进行标准化处理,即满足:

求随机下降的一个batch进行正规化,以减少计算量后进行规模和位置的线型转变得到yi,满足:

其中,为输入数据的标准化处理结果,∈为噪声项,yi为batch正则化后进行规模和位置的线性转变结果,γ和β分别表示权重和偏置项,两个参数需要通过神经网络进行训练,完成特征映射的全部环节,

S222:根据映射运算中获取的连续矩阵,在LSTM网络的训练中,引入字典集与元矩阵进行匹配,获取最大概率,根据文本描述和连续分块矩阵的匹配度进行捕获关键词,同时删除在字典集已经被捕获的关键词;

S3:图像预处理得到图像的特征向量;

S4:特征向量输入联合神经网络进行类别判定。

2.根据权利要求1所述的一种基于联合神经网络模型的图像内容描述自动生成方法,其特征在于,构建联合神经网络包括如下子步骤:

S11:利用Flickr30k获得最大的图像字幕数据集,包括训练,验证,测试三部分;

S12:其中数据集中的训练集中的图像处理作为卷积神经网络的输入;

S13:将训练集数据输入激活函数为ReLU的ResNet神经网络中进行多尺度检测和定向检测,其中卷积核规格分别为7*7,1*1,3*3,5*5;

S14:在卷积层每层中将会复制输出向量进行映射运算,提取每层中的特征簇;

S15:构建2层的LSTM,将训练集中的文本向量集和ResNet提取的特征映射集进行匹配和反向传播计算,根据LSTM神经网络长短期记忆训练,完成联合神经网络的构建。

3.根据权利要求2所述的一种基于联合神经网络模型的图像内容描述自动生成方法,其特征在于,映射运算模型构建包括如下子步骤:

S141:构建恒等快捷连接映射结构;

S142:在恒等快捷连接映射结构中的增加首端和末端的1*1卷积层;

S143:利用ResNet网络结构将卷积网络进行拼接组合。

4.根据权利要求1所述的一种基于联合神经网络模型的图像内容描述自动生成方法,其特征在于:所述图像预处理,包括以下子步骤:

S31:使用Flickr30k数据集中训练集图片作为ResNet网络的输入;

S32:将训练集中的图像根据较小的边缩放至规格为256*480的图像,满足scale算法输入;

S33:随机剪裁224*224的图像规格,同时对图像进行随机水平镜像,同时减去均值,作为神经网络的输入值。

5.根据权利要求1所述的一种基于联合神经网络模型的图像内容描述自动生成方法,其特征在于,所述类别判定,包括以下步骤:将图像预处理中得到的特征向量输入训练后的神经网络中,经过多层卷积层卷积、通过修改的特征映射连接,最终通过LSTM网络解码解析出图像叙述文本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创意信息技术股份有限公司,未经创意信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910453505.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top