[发明专利]一种基于生成对抗网络的图像自动文本标注方法在审
申请号: | 201710396148.5 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107330444A | 公开(公告)日: | 2017-11-07 |
发明(设计)人: | 胡伏原;吕凡;沈军宇;孙钰;李林燕;李宏 | 申请(专利权)人: | 苏州科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 苏州睿昊知识产权代理事务所(普通合伙)32277 | 代理人: | 伍见 |
地址: | 215009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 图像 自动 文本 标注 方法 | ||
1.一种基于生成对抗网络的图像自动文本标注方法,其特征在于,包括以下步骤:
S 101将CNN多标签分类模块和LSTM语句生成模块标注作为生成器,将LSTM语句特征提取模块和分类器标注作为判别器;
S 102所述CNN多标签分类模块提取到图片的信息,然后通过LSTM语句生成模块生成语句,生成的语句为所述生成器生成的假的语句;
S 103将生成的语句和真实的语句输入进行训练,所述LSTM语句特征提取模块对生成的语句和真实的语句进行训练,直至所述判别器无法判别真实语句和生成语句。
2.根据权利要求1所述的基于生成对抗网络的图像自动文本标注方法,其特征在于,S 103中还包括通过所述判别器判别通过所述生成器生成的语句是否描述图片的方法,包括以下步骤:
S 201将所述生成器生成的句子记为Sfake,真实的句子记为Sreal,训练的一张图片记为Imatch,引入一张不匹配的图片记为Imismatch;
S 202生成语句Sfake和真实语句Sreal由LSTM语句特征提取模块进行特征提取,提取到的特征、Match图像特征、Mismatch图像特征进行特征结合,获得语句特征集合;
S 203所述分类器将语句特征集合中的语句特征进行真伪判别,判别生成的语句是否属于训练图像。
3.根据权利要求2所述的基于生成对抗网络的图像自动文本标注方法,其特征在于,S203中,分类器在判别生成的语句是否属于训练图像的过程中包括以下组合:
Sfake Imismatch无法通过判别器;
Sfake Imatch半通过判别器,获得score sf;
Sreal Imismatch半通过判别器,获得score sw;
Sreal Imatch通过判别器,获得score sr。
4.根据权利要求1-3任意一项所述的基于生成对抗网络的图像自动文本标注方法,其特征在于,所述判别器通过训练识别真实语句,并且识别真实语句是否匹配图片,所述判别器的损失函数表示为:
5.根据权利要求1-3任意一项所述的基于生成对抗网络的图像自动文本标注方法,其特征在于,所述生成器利用多标签图像自动语句标注模型生成逼近真实语句的句子,所述生成器的损失函数表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科技大学,未经苏州科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710396148.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种同步器
- 下一篇:用户属性的预测方法和装置