[发明专利]一种循环可变形融合的压缩视频质量增强方法有效
申请号: | 202210110450.0 | 申请日: | 2022-01-29 |
公开(公告)号: | CN114511485B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 叶茂;彭柳寒 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06N3/0464;G06N3/047;G06N3/048;G06N3/08 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 循环 变形 融合 压缩 视频 质量 增强 方法 | ||
1.一种循环可变形融合的压缩视频质量增强方法,其特征在于,包括下列步骤:
获取待处理的压缩视频帧序列Xt={xt-R,...,xt-1,xt,xt+1,...,xt+R},其中,xt表示目标帧,压缩视频帧序列Xt中的非目标帧为参考帧xi,R为指定的正整数;
依次遍历压缩视频帧序列Xt的参考帧xi,将视频帧对(xt,xi)依次输入可变形对齐模块,所述可变形对齐模块为神经网络,用于融合目标帧xt和参考帧xi的时间信息得到对齐特征yi,并将对齐特征yi输入循环融合模块;
所述循环融合模块为神经网络,用于将循环融合模块在上一次执行时输出的隐藏状态特征h减去当前对应的对齐特征yi,得到目标帧xt待改进的特征ui,并将特征ui经第一卷积网络后再与隐藏状态特征h相加得到融合特征li,所述融合特征li经第二卷积网络产生循环融合模块输出的新的隐藏状态;其中,隐藏状态特征h的初始特征为:目标帧xt经特征提取网络得到的目标帧的初始特征;所述循环融合模块循环执行2R次,得到2R个融合特征li;
将所有融合特征li在通道维度上拼接后,经1×1的卷积得到最终的融合特征Ffuse,并将融合特征Ffuse输入多尺度注意力重建模块;所述多尺度注意力重建模块为神经网络,用于预测村增强残差Fenc;
将增强残差Fenc和目标帧xt逐元素相加得到目标帧xt的增强帧
所述循环融合模块的第一卷积网络与第二卷积网络的网络结构相同,包括至少两层顺次连接的3×3的卷积;
所述多尺度注意力重建模块依次包括多个多尺度注意力块和一个3×3的卷积;
所述多尺度注意力重建模块的多尺度注意力块的网络结构相同,包括四个顺次连接的3×3的卷积,以及一个金字塔拆分注意力模块,前三个3×3的卷积后设置有非线性激活函数,所述金字塔拆分注意力模块用于将第四个卷积的输出特征在通道维度平均分为四组,每组使用不同大小卷积核进行卷积,并通过注意力机制模块预测每组的权重值,再通过Softmax对各组的权重值进行校准,得到多尺度通道校准后的权重值,将校准后的权重值与每组相应的特征图逐元素相乘,得到多尺度注意力块的输出。
2.如权利要求1所述的方法,其特征在于,所述可变形对齐模块依次包括两层3×3的卷积、至少一个U-net网络和一个可变形卷积,其中,第一个3×3的卷积的输入为视频帧对(xt,xi),第一个3×3的卷积的输出分别与每个U-net网络的输入相连,且前一个U-net网络的输出与后一个U-net网络的输入相连,所有U-net网络的输出相加后接入第二个3×3的卷积,该第二个3×3的卷积的输出与可变形卷积的输入相连,且可变形卷积的输入还包括视频帧对(xt,xi)。
3.如权利要求2所述的方法,其特征在于,所述U-net网络的数量为2。
4.如权利要求1所述的方法,其特征在于,所述特征提取网络包括至少两层顺次连接的3×3的卷积。
5.如权利要求1所述的方法,其特征在于,所述多尺度注意力块的数量为7。
6.如权利要求1至5任一项所述的方法,其特征在于,采用端到端的方式联合训练获取增强帧的所有网络的网络参数,且训练时采用的损失函数为:其中,表示增强帧,X表示原始视频帧,∈表示预置的常数。
7.如权利要求6所述的方法,其特征在于,常数∈的取值为10-6。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210110450.0/1.html,转载请声明来源钻瓜专利网。