[发明专利]图像标注语句自动生成方法有效
申请号: | 201810748973.1 | 申请日: | 2018-07-10 |
公开(公告)号: | CN108985370B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 白亮;刘爽;王昊冉;郭金林;郭延明 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 邱轶 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标注 语句 自动 生成 方法 | ||
1.一种图像标注语句自动生成方法,其特征在于,包括步骤:
对给定图像进行特征提取得到图像局部特征和图像全局特征;
通过给定特征映射网络对所述给定图像以及给定训练数据集中的每个训练图像进行特征映射分别得到对应所述给定图像的目标给定图像特征向量以及对应所述训练图像的目标训练图像特征向量;
计算所述目标给定图像特征向量与每个所述目标训练图像特征向量的余弦相似度、并将最大的多个所述余弦相似度对应的多个所述训练图像作为所述给定图像的最近邻的多个训练图像;
获取所述最近邻的多个训练图像对应的多个标注语句;
在所述多个标注语句中随机选择部分标注语句并计算所述部分标注语句中的每个标注语句与所述多个标注语句中除所述部分标注语句之外的剩余标注语句的平均相似度;
通过Skip-Thoughts模型对最大的所述平均相似度对应的所述标注语句进行转换处理以得到参考标注语句向量;
初始化前一时间步的隐藏层状态;以及
循环执行如下步骤以生成包括多个图像标注词语的图像标注语句:
将所述前一时间步的隐藏层状态、当前时间步输入的词语向量输入到长期短期记忆网络中以生成当前时间步的视觉哨兵向量和当前时间步的隐藏层状态、并将所述前一时间步的隐藏层状态更新为所述当前时间步的隐藏层状态;
根据注意机制将所述参考标注语句向量、所述当前时间步的视觉哨兵向量和所述当前时间步的隐藏层状态作用于所述图像全局特征以生成所述图像局部特征的权重向量;以及
根据所述权重向量和所述图像局部特征通过多层神经网络预测得到当前时间步输出的所述图像标注词语。
2.如权利要求1所述的图像标注语句自动生成方法,其特征在于,所述对给定图像进行特征提取得到图像局部特征和图像全局特征的步骤为:通过卷积神经网络对所述给定图像进行特征提取得到所述图像局部特征和所述图像全局特征。
3.如权利要求1所述的图像标注语句自动生成方法,其特征在于,所述给定训练数据集包括:所述训练图像以及所述训练图像对应的所述标注语句。
4.如权利要求1所述的图像标注语句自动生成方法,其特征在于,所述给定训练数据集为MSCOCO数据集。
5.如权利要求1所述的图像标注语句自动生成方法,其特征在于,所述给定特征映射网络为VGG网络。
6.如权利要求1所述的图像标注语句自动生成方法,其特征在于,所述初始化前一时间步的隐藏层状态为将前一时间步的隐藏层状态初始化为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810748973.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序