[发明专利]一种基于图像背景掩膜的目标候选区域提取方法有效

申请号：	201810325376.8	申请日：	2018-04-12
公开（公告）号：	CN108648197B	公开（公告）日：	2021-09-07
发明（设计）人：	侯春萍;莫晓蕾;杨阳;管岱;夏晗	申请（专利权）人：	天津大学
主分类号：	G06T7/11	分类号：	G06T7/11;G06K9/34;G06N3/04;G06N3/08
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	程毓英
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于图像背景目标候选区域提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图像背景掩膜的目标候选区域提取方法，包括下列步骤：

(1)构建图像背景掩模数据集

选取原始图像及一一对应的标签构建图像背景掩模数据集，标签指明了所有物体的位置，将一一对应的原始图像与灰度掩膜图像或黑色掩膜图像水平拼接成一张图片，并将数据集分为含训练图像对的训练集和含测试图像对的测试集；

(2)搭建GAN模型，采用训练GAN的方式为图像增加背景掩膜

GAN模型由生成模型和判别模型组成，构建生成模型使其学习到从输入图像以及随机噪声向量到输出图像的映射，判别模型通过鉴别其输入是否为真正的图像即非生成图来约束生成器，使生成模型的输出结果更接近所需的背景掩模图像；生成模型采用全卷积结构，整个网络由包含八层的编码器和包含八层的解码器组成，采用编码器-解码器架构，编码模块与解码模块的对应层之间加入了跳跃链接，使得对应的特征图能够按通道连接起来，在多次下采样过程中保留不同分辨率下像素级的细节信息；采用分块判别器的结构，具有不同大小的感受野，以提升生成图像高频部分的质量，最后一层的卷积层使用Sigmoid函数，其特征图被映射到一个一维的输出，表示背景掩模图像正确的概率；

(3)定义损失函数

为在处理图像中高频的结构信息细节部分的同时，使生成的图片和训练的目标图片尽量相似，将损失函数定义为GAN的目标函数与合成图像的一范数距离损失的结合；

(4)模型训练

将步骤(1)中得到的训练集，每次随机选择一副图像对，即原始图像与基于标签的背景掩模图像的图像对，送入网络进行训练，首先固定生成模型，更新判别模型的网络权重，然后固定判别模型，将判别模型的判别结果回传至生成模型，更新生成模型的权重，如此反复，固定一方更行另一方的权重交替迭代，直到双方达到一个动态平衡，此时判别模型无法区分出哪一张是生成模型产生的合成图，可以认为生成模型产生了足够近似标签的背景掩模图像。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810325376.8/1.html，转载请声明来源钻瓜专利网。

上一篇：基于递归连接式卷积神经网络的图像分割方法及存储介质
下一篇：一种视频内多目标运动人体区域的分割方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于图像背景掩膜的目标候选区域提取方法有效

专利文献下载