[发明专利]一种基于图像背景掩膜的目标候选区域提取方法有效
申请号: | 201810325376.8 | 申请日: | 2018-04-12 |
公开(公告)号: | CN108648197B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 侯春萍;莫晓蕾;杨阳;管岱;夏晗 | 申请(专利权)人: | 天津大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 背景 目标 候选 区域 提取 方法 | ||
本发明涉及一种基于图像背景掩膜的目标候选区域提取方法,包括下列步骤:(1)构建图像背景掩模数据集;(2)搭建GAN模型,采用训练GAN的方式为图像增加背景掩膜;(3)定义损失函数:为在处理图像中高频的结构信息细节部分的同时,使生成的图片和训练的目标图片尽量相似,将损失函数定义为GAN的目标函数与合成图像的一范数距离损失的结合;(4)模型训练。
技术领域
本发明属于目标检测与深度学习领域,涉及一种基于图像掩膜思想的,应用生成式对抗网络模型完成自然图像中目标候选区域提取的方法。
背景技术
目标候选区域的提取即在图像中找出目标物体可能存在的区域,属目标检测范畴。传统的目标检测方法通常使用滑动窗口方式,这种遍历整幅图像的区域选择策略没有针对性,时间复杂度高,窗口冗余。而区域提名在此基础上,通过利用图像中的纹理、边缘、颜色等信息可以预先找出图像中目标物体有可能出现的位置。常用的区域提名算法是选择性搜索算法。
卷积神经网络受视觉系统的结构启发而产生,是一种为了处理二维输入数据而特殊设计的多层人工神经网络。其学习能力极强,不需要知道输入和输出之间的精确数学表达式,只需用已知的模式训练卷积神经网络,就可以使网络具有输入与输出之间的映射能力[1]。
得益于卷积神经网络和区域提名算法的发展,目标检测任务逐渐由传统方法向深度学习方法转变。 2015年,任少卿等人改进了提候选区域方法,提出了候选区域网络(Region Proposal Network,RPN)以代替选择性搜索算法,可以直接利用神经网络对图像中的候选区域进行捕获。RPN引入空间金字塔池化层的映射机制,在最终的卷积特征层上利用9种不同大小、不同纵横比的矩形包围框进行候选区域提名,再配合边框回归,得到与目标接近的候选框[2]。
图像背景掩膜,即令目标所在区域与原图相同,而该区域外的值都设为0或者都为灰度值。这种图像掩膜的方式相当于屏蔽了背景区域,完成了目标候选区域的提取,把目标可能存在的位置(候选区域)尽可能地突出显示了出来。这种目标候选区域提取方法十分直观,关键是找到为图像合理增加背景掩膜的方法。
近年来,生成式对抗网络(Generative Adversarial Networks,GAN)被广泛地应用到图像转换、图像处理等领域,是深度学习算法中的一种新型的网络,通过由卷积神经网络构建的生成网络和判别网络进行对抗式的交替训练,最终达到动态平衡。生成模型有助于生成相关数据,提高数据数量,从而利用半监督学习提升学习效率。而判别模型可以判断样本的真实度,通过不断迭代完成自我优化,使得生成样本越来越接近真实样本。这种网络适用于完成图片翻译的工作。
不同于传统的基于滑动窗口的选择性搜索算法,以及使用RPN进行候选区域提取的方法,本发明基于背景掩膜的思想,应用GAN对自然图像增加背景掩膜以完成目标候选区域的提取。
[1]刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1930.
[2]Ren S,He K,Girshick R et al.Faster R-CNN:Towards real-time objectdetection with region proposal networks[J].IEEE Transactions on PatternAnalysis and Machine Intelligence,2017,39(6):1137-1149.
发明内容
本发明的目的是提供一种可以提高目标检测率的目标候选区域提取方法。本发明应用卷积神经网络,基于背景掩膜的思想,提出一种利用GAN模型的自然图像候选区域提取方法。技术方案如下:
一种基于图像背景掩膜的目标候选区域提取方法,包括下列步骤:
(1)构建图像背景掩模数据集
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810325376.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序