[发明专利]一种基于双帧编码解码模型的前景提取方法在审

申请号：	201911030172.2	申请日：	2019-10-28
公开（公告）号：	CN110852199A	公开（公告）日：	2020-02-28
发明（设计）人：	赖少川;杨大慎;何永君;陈晓华;姜红涛;王佳欣;马翠霞	申请（专利权）人：	中国石化销售股份有限公司华南分公司;中国科学院软件研究所
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06K9/38;G06K9/40;G06N3/04;G06N3/08
代理公司：	北京君尚知识产权代理有限公司 11200	代理人：	余长江
地址：	510000 广东省广州市天***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于编码解码模型前景提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于双帧编码解码模型的前景提取方法，属于计算机视觉领域，训练双帧编码解码模型，训练好后对双帧图像进行预处理，特征提取，特征图融合，卷积，上采样，直至得到与输入图像同等尺寸的最终的融合特征图；对最终的融合特征图进行softmax，得到相应的前景预测概率，经过二值化，提取出前景区域。本方法可以在产生运动信息的同时，产生相应的图像特征，并最终实现对前景目标的预测。

技术领域

本发明属于计算机视觉领域，具体涉及一种基于双帧编码解码模型的前景提取方法。

背景技术

随着计算机的普及以及摄像机的普及，越来越多的视频录像需要进行自动分析。采用人工分析的方法不仅要消耗大量的人力成本，还难以做到可靠与实时。采用计算机对视频进行处理是目前视频处理的主要发展方向。而前景提取是计算机处理视频的基本技术之一，能够将视频研究分析的重点集中到少量的前景目标区域，对视频图像中的重要区域进行感知，可以用来帮助用户浏览视频中的重要信息，提高用户分析视频录像的效率。

常见的用于前景提取的算法为帧差法，即通过相邻两帧图像之间像素值的差异来判断目标是否为前景。这样二值化的方法难以应对光照变化、视频抖动、前景目标缓慢移动等难题，虽然之后相应的一些改进方法，如高斯模型等，采用统计的方法对前景与背景进行建模，这在一定程度上缓解了以上难题，但基于简单的像素特征或者相应人工设计的一些局部特征，无法对复杂的现实世界进行很好的建模。因此，高斯模型等方法面对背景变化较大的视频，无法获得高精度的前景提取结果。

深度学习技术的出现，使得对复杂背景进行精确建模成为可能。深度学习可以通过多层网络，利用已经标注的数据集，训练得到对数据进行精确预测的模型。深度学习相比传统机器学习，需要更大的计算量，同时也具备更强的数据学习能力。结合GPU强大的计算能力，深度学习在图像处理，音频处理，自然语言处理上取得了重大突破。

常见的深度神经网络有前馈神经网络FFNN(Feed-Forward Neural Networks)，长短期记忆网络LSTM(Long Short-Term Memory)，生成对抗网络GAN(GenerativeAdversarial Networks)，自动编码解码器AED(Auto-Encoders-Decoder)，卷积神经网络CNN(Convolutional Neural Networks)，循环神经网络RNN(Recurrent NeuralNetworks)。以上网络相互之间可能存在包含或者交叉的关系。如长短期记忆网络LSTM是循环神经网络RNN的一种常见结构，卷积神经网络CNN可以用来搭建自动编码解码器AED。其中，卷积神经网络由于其良好的局部特征提取能力以及易于训练的特点，常用于图像数据的处理，如图像分割，目标检测以及图像分割。

近来年，涌现的图像分割网络代表有FCN(Full Convolutional Network)，U-Net及DeepLab系列。其主要特点在图像分割网络的基础上，采用网络进行上采样进行分辨率恢复，从而实现对图像的逐像素分类。这些网络通过学习图像中的语义特征，如颜色，纹理，轮廓等，实现对图像的分割。对于前景提取，仅仅学习目标的语言特征是不够的，还需要学习目标的动态特征。

发明内容

本发明的目的在于提供一种基于双帧编码解码模型的前景提取方法，由于编码解码模型在图像分割领域取得了良好的结果，但难以对动态的信息进行建模。直接结合光流预测无法实现基本图像特征的共享，从而会导致模型运行速度的降低。而直接采用双帧方法，并对实际结果进行预测，可以在产生运动信息的同时，产生相应的图像特征，并最终实现对前景目标的预测。

为实现上述发明目的，本发明采用如下的技术方案：

一种基于双帧编码解码模型的前景提取方法，将两帧图像输入到已训练好的双帧编码解码模型中进行处理，处理的步骤包括：

1)对两帧图像进行预处理，包括噪声去除和归一化；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国石化销售股份有限公司华南分公司;中国科学院软件研究所，未经中国石化销售股份有限公司华南分公司;中国科学院软件研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911030172.2/2.html，转载请声明来源钻瓜专利网。

上一篇：人型玩具
下一篇：一种圈梁、构造柱和夯土墙协同沉降的施工方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于双帧编码解码模型的前景提取方法在审

专利文献下载