[发明专利]一种基于深度学习的去除视频水印的方法在审
申请号: | 202010806036.4 | 申请日: | 2020-08-12 |
公开(公告)号: | CN111918144A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 覃琴;颜靖柯;王鑫 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | H04N21/8358 | 分类号: | H04N21/8358;G06T1/00;G06N3/08;G06N3/04 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 覃永峰 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 去除 视频 水印 方法 | ||
1.一种基于深度学习的去除视频水印的方法,其特征在于,包括如下步骤:
1)视频处理:采用视频处理opencv工具把视频转换为图片,将训练图片分为有带水印的图片和不带水印的图片;
2)数据增强:采用mosaic数据增强,其过程是:随机添加水印噪声,每次读取4张图片,对带水印的图片和不带水印图片同时做出翻转、缩放、旋转变化相同的变换,并且按照四个方向位置摆好,进行图片的组合和框的组合,合成一张图片;
3)模型训练:将经过数据增强的图片传入改进后的Unet特征提取网络中进行训练,在改进后的Unet特征提取网络中,采用注意力机制和强化学习,采用L2loss的计算方式,进行图片的训练,Unet特征提取网络采用强化学习找到合适的通道数,过程如下:首先设定搜索的Unet的通道数为1-30;初始化DQN的记忆库Memory D,设置它的容量为200;初始化Q估计网络,随机生成权重ωω;初始化target Q网络,权重为ω-=ω ω-=ω;初始化最初状态initial state S1S1;循环遍历step=1,2,…,100,策略生成action atat,at=maxaQ(St,a;ω)at=maxaQ(St,a;ω);其中St代表loss的值,a代表行为选择的通道数,执行actionatat,接收reward rtrt及新的state St+1St+1;reward rtrt表示接收的奖励,将(St,at,rt,St+1)(St,at,rt,St+1)存入D中;从D中随机抽取一个minibatch的transitions(Sj,aj,rj,Sj+1)(Sj,aj,rj,Sj+1);令yj=rjyj=rj,如果j+1j+1步是terminal的话,否则,令yj=rj+γmaxa′Q(St+1,a′;ω-)yj=rj+γmaxa′Q(St+1,a′;ω-);对(yj-Q(St,aj;ω))2(yj-Q(St,aj;ω))2关于ωω使用梯度下降法进行更新;每隔C steps更新target Q网络,ω-=ω ω-=ω,最终找到合适的通道数;
4)实现去除水印:最终保存的训练loss值最低的模型权重,进行模型权重加载对视频进行去除水印操作,将视频提取出带水印和不带水印的图片作为训练样本,以去除水印后的样本和无水印的样本作为像素级别对比,对比准确度和平均误差mse,在进行多次的训练后,使准确率和平均误差都达到最优,能够得到训练好的预设权重,加载出预设权重,对带水印的视频进行处理。
2.根据权利要求1所述的基于深度学习的去除视频水印的方法,其特征在于,步骤3)中所述的L2loss的计算方式为在去除水印视频方法时损失函数计算的时候,采用对于L2损失函数计算,该函数的最优解在被估计真实平均值处取得z,z=Ey{y},计算损失值的函数为L(z,y)=(z-y)2,在网络中输入目标对(xi,yi)优化,主要是优化arg minθE(x,y){L(fθ(x),y)},其中,网络函数为fθ(x),θ为网络参数,网络学习到输出所有可能结果的平均值,当给定的训练数据无限多时,目标函数的解与原目标函数的解相同,当训练数据有限多时,估计的均方误差等于目标中的噪声的平均方差除以训练样例的数目,即:
3.根据权利要求1所述的基于深度学习的去除视频水印的方法,其特征在于,步骤3)中所述的改进后的Unet特征提取网络为:U-net特征提取网络特征提取是用于图像分割,分割出图像中所需要物体一个完整准确的轮廓,它全程采用valid来进行卷积下采样,然后提取出一层又一层的特征,利用这一层又一层的特征,再进行上采样,允许更多的原图片的纹理信息在高分辨率层进行传播,在上采样部分融合一部分特征,最后得出一个每个像素点对应其种类的图像,在改进的unet部分,采用强化学习DQN方法,搜索最优通道参数,减少unet的通道数量,使它的参数原本从1200w减少到200w,同时采用注意力机制,对一些需要重点特征的区域,投入更多的权重,抑制图片中与水印无关的其它特征。
4.根据权利要求2所述的基于深度学习的去除视频水印的方法,其特征在于,所述强化学习DQN方法为:DQN中采用卷积神经网络来逼近行为值函数,一个是采用target Qnetwork来更新target,还有一个是采用经验回放Experience replay,DQN中经验回放即用一个Memory来存储经历过的数据,每次更新参数的时候从Memory中抽取一部分数据来用于更新,以此来打破数据间的关联,最终来找到最优路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010806036.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于电子治超的多维度车辆特征精确实时判定系统
- 下一篇:一种可驾驶的收集器