[发明专利]基于Transformer的视频时空超分辨率方法在审
申请号: | 202210346886.X | 申请日: | 2022-04-02 |
公开(公告)号: | CN114757828A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 邢晓芬;曹俏钰;徐向民;郭锴凌 | 申请(专利权)人: | 华南理工大学;中山市华南理工大学现代产业技术研究院 |
主分类号: | G06T3/40 | 分类号: | G06T3/40 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 transformer 视频 时空 分辨率 方法 | ||
1.基于Transformer的视频时空超分辨率方法,其特征在于,包括以下步骤:
S1、采集视频时空超分辨率的模型训练样本;
S2、构建高帧率低分辨率视频序列生成模型,基于Transformer注意力机制的时域特征融合的生成中间帧,生成高帧率低分辨率视频序列;
S3、构建高帧率高分辨率视频序列生成模型,基于Transformer注意力机制的时空域特征融合,重建高帧率高分辨率视频序列;
S4、构建基于Transformer的视频时空超分辨率模型并训练,根据训练好的基于Transformer的视频时空超分辨率模型对视频序列进行视频时空超分辨率重建。
2.根据权利要求1所述的基于Transformer的视频时空超分辨率方法,其特征在于,步骤S1中,选用涵盖各种场景和动作的视频序列的原始数据集;
将原始数据集提供的视频序列IHR视为高帧率高分辨率视频序列;原始数据集中每个视频序列表示为T表示视频序列的长度,即一段视频的帧数,表示视频序列中第i帧图像;i=1,…,T;
对原始数据集中的视频序列的预处理具体如下:
先通过对原始数据集中原有的高帧率高分辨率视频序列IHR通过双三次插值进行r倍下采样处理得到高帧率低分辨率视频序列,再进行a倍下采样处理得到低帧率低分辨率视频序列,构建训练数据集。
3.根据权利要求1所述的基于Transformer的视频时空超分辨率方法,其特征在于,步骤S2中,构建的高帧率低分辨率视频序列生成模型中,基于Transformer注意力机制的时域特征融合的生成中间帧,生成高帧率低分辨率视频序列,包括以下步骤:
S2.1、对预处理得到的低帧率低分辨率视频序列,通过卷积和残差模块计算得到低帧率低分辨率初始特征序列,在低帧率低分辨率视频序列中相邻的两帧图像之间生成中间帧图像,对于要生成的中间帧图像即第t帧图像,前一帧图像的特征记为Ft-1,后一帧图像的特征记为Ft+1;
S2.2、基于Transformer注意力机制,获取要生成的中间帧图像的相邻帧图像特征的联系信息,得到帧之间的特征联系信息;对于要生成的中间帧图像的相邻的两帧图像特征,相邻帧图像特征的联系信息包括中间帧图像的前一帧图像特征到中间帧图像的后一帧图像特征的正向联系信息Rt-1→t+1,以及中间帧图像的后一帧图像特征到中间帧图像的前一帧图像特征的反向联系信息Rt+1→t-1;
S2.3、融合中间帧图像的前一帧图像特征Ft-1和正向联系信息Rt-1→t+1,得到由前往后的正向中间帧特征Ft-1→t;融合中间帧图像的后一帧图像特征Ft+1和反向联系信息Rt+1→t-1,得到由后往前的反向中间帧特征Ft+1→t;将正向中间帧特征Ft-1→t和反向中间帧特征Ft+1→t进行融合,具体为将正向中间帧特征Ft-1→t和反向中间帧特征Ft+1→t拼接再通过卷积计算,得到最终的中间帧特征Fmiddle,具体如下:
Ft-1→t=Ft-1+Rt-1→t+1;
Ft+1→t=Ft+1+Rt+1→t-1;
Fmiddle=Conv(Concate(Ft-1→t,Ft+1→t));
S2.4、对生成的最终的中间帧特征Fmiddle通过RDN模块进行特征学习,得到中间帧的特征信息Ft,再通过卷积计算将中间帧的特征信息转为图像信息,生成中间帧图像;中间帧图像和预处理得到的低帧率低分辨率视频序列按时间顺序拼接成高帧率低分辨率视频序列,即将中间帧图像插入对应的前一帧图像和后一帧图像之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;中山市华南理工大学现代产业技术研究院,未经华南理工大学;中山市华南理工大学现代产业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210346886.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于计算机视觉的纺织梳理系统
- 下一篇:一种太阳能防火复合背板及其制备方法
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法