[发明专利]一种视频在线稳定方法及系统在审
申请号: | 201811599338.8 | 申请日: | 2018-12-26 |
公开(公告)号: | CN111371983A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 胡事民;汪淼;杨国烨;林锦坤 | 申请(专利权)人: | 清华大学 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;H04N5/262;H04N5/268;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 在线 稳定 方法 系统 | ||
1.一种视频在线稳定方法,其特征在于,包括:
S1,获取待测视频和训练后的卷积神经网络,训练后的卷积神经网络通过训练视频集对初始卷积神经网络进行训练得到;
S2,将所述待测视频中的当前图像、和位于所述当前帧图像之前的若干帧图像输入到训练后的卷积神经网络中,获取变形参数,所述当前图像和位于所述当前帧图像之前的图像是稳定的,所述变形参数表示将不稳定图像转换为稳定图像的网格参数;
S3,通过所述变形参数对所述当前帧图像的下一帧图像进行转换,获取稳定后的下一帧图像,并将稳定后的下一帧图像重新作为所述当前帧图像;
S4,重复步骤S2至S3,直到处理完所述待测视频的所有帧,获取稳定后的待测视频。
2.根据权利要求1所述方法,其特征在于,所述训练视频集中包括若干对训练视频,对于任一对训练视频,所述任一对训练视频中两个训练视频的拍摄路径和拍摄时间相同,所述任一对训练视频中的其中一个视频是通过位于稳定云台上的相机拍摄得到的,所述任一训练视频中的另外一个视频与使用者的手或身体的运动一致。
3.根据权利要求1所述方法,其特征在于,所述初始卷积神经网络为StabNet,StabNet由一个编码器和一个网格格点回归器组成,所述编码器由ResNet-50实现,所述网格格点回归器由若干个全连接层组成。
4.根据权利要求1所述方法,其特征在于,所述通过所述变形参数对所述当前帧图像的下一帧图像进行转换,获取稳定后的下一帧图像稳定后的下一帧图像,具体为:
其中,表示稳定后的下一帧图像,It表示所述当前帧图像的下一帧图像,Ft表示所述变形参数。
5.根据权利要求4所述方法,其特征在于,所述对初始卷积神经网络进行训练过程中约束条件中的视频稳定项为:
Lstab(Ft,It)=α1Lpixel(Ft,It)+α2Lfeature(Ft,It),
α1=50,α2=1,
其中,Pt为m个It和I′t中对应的特征点对集合,Lstab(Ft,It)表示生成结果的稳定性损失,Lpixel(Ft,It)表示生成结果与训练数据中稳定视频的第t帧,即稳定监督图像的逐像素差别损失,Lfeature(Ft,It)表示生成结果与所述稳定监督图像通过的对应特征点距离损失,I′t表示所述稳定监督图像,m表示求得的特征点数,表示所述稳定监督图像的第i个特征点,表示生成结果图像的第i个特征点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811599338.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音频传输方法、装置、系统和计算机可读存储介质
- 下一篇:电连接器