[发明专利]一种基于深度神经网络的移除图像内台标和字幕的方法有效
申请号: | 201811286931.7 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109472260B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 王炜;李杰;温序铭;谢超平 | 申请(专利权)人: | 成都索贝数码科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 李春霖 |
地址: | 610041 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 图像 台标 字幕 方法 | ||
本发明公开了一种基于深度神经网络的移除图像内台标和字幕的方法,涉及图像修复技术领域,本发明包括如下步骤:S1、建立图像修复模型;S2、训练集图像预处理;S3、处理训练数据:将训练图像作为真实图像Pt;将训练图像中Mask1区域内的像素点RGB值置为0,作为训练图像P1;将训练图像中Mask2区域内的像素点RGB值置为0,作为训练图像P2;S4、训练图像修复模型,得到训练好的图像修复模型;S5、图像修复:将需要去除台标和字幕的图像或视频预处理后,输入训练好的图像修复模型中,将图像修复模型输出的图像与原图像结合,得到最终图像输出,本发明基于深度学习思想,实现自动、快速去除图像中的台标和字幕,处理过程清晰明确,修复实时性强,适用范围广。
技术领域
本发明涉及图像修复技术领域,更具体的是涉及一种基于深度神经网络的移除图像内台标和字幕的方法。
背景技术
随着互联网和移动互联网的高速发展,网络上的图片、视频的总量和播放时长不断上升,在2017年仅仅是YouTube上的日视频播放总量就已经超过10亿小时。某些视频画面中存在台标和字幕,由于年代久远或其他种种原因无法得到原始视频画面,如何在现有视频画面中实时、快速地去除台标和字幕等区域,以降低台标或字幕对内容的不利干扰,使观众获得良好的视觉体验是当前亟待解决的问题。
现有的图像修复方法包括以下三种:
1、手工添加马赛克
通过视频编辑软件在台标和字幕区域直接添加马赛克以遮挡原有内容,这种方法虽然方式简单,但是视觉效果上受到了极大的影响,与原有初衷大相径庭,并不是一种合理的解决方法;
2、基于图像块的图像修复
这种方法通过收集待修复区域附近的小图像块来合成修复区域的纹理,这种方法的缺点也很明显:通过这种方式无法得到图像的整体语义,也就无法对修复区域进行语义层面的修复,因此修复复杂场景的能力较差,所需的计算量往往也很大;
3、基于数据库的图像修复
这种方法假定数据库中存在与待修复图像相似的内容,用视觉上足够相似的样本来估计当前图像中的待修补区域,当数据库内存在相似样本时图像修复的效果很好,但是当数据库中不存在相似样本时,修补结果可能就与真实情况大相径庭,极大地限制了可能的应用场景。
发明内容
本发明的目的在于:为了解决现有的图像修复方法修复影音图像中复杂场景的能力较差,所需计算量大,并且应用场景具有局限性的问题,本发明提供一种基于深度神经网络的移除图像内台标和字幕的方法,结合卷积神经网络和生成对抗网络的特性,构造图像修复模型,并对图像修复模型进行大量数据训练,然后将需要移除台标和字幕的视频帧带入图像修复模型进行计算,自动得到去除台标和字幕的图像帧,修复实时性强,适用范围广。
本发明为了实现上述目的具体采用以下技术方案:
一种基于深度神经网络的移除图像内台标和字幕的方法,包括如下步骤:
S1、建立图像修复模型:由类“U-net”网络和GAN组成图像修复模型,类“U-net”网络作为GAN的Generator;
S2、训练集图像预处理:将训练集中的图像裁剪或缩放至限定大小,得到训练图像,根据通常情况下台标和字幕所在区域,将训练图像在逻辑上划分为区域1、区域2和区域3,其中区域1为台标所在区域,区域2为字幕所在区域,并在区域1和区域2中分别生成对应的Mask1和Mask2;
S3、处理训练数据:将未经处理的训练图像作为真实图像Pt;将训练图像中Mask1区域内的像素点RGB值置为0,作为训练图像P1;将训练图像中Mask2区域内的像素点RGB值置为0,作为训练图像P2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811286931.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序