[发明专利]视频预测方法、装置、计算机设备和可读存储介质在审
申请号: | 202010564352.5 | 申请日: | 2020-06-19 |
公开(公告)号: | CN111582254A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 周康明;郜杰 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 仝丽 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 预测 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种视频预测方法,其特征在于,所述方法包括:
将获取的视频数据输入移动场预测网络,得到预测移动场;所述视频数据包括多帧具有相同时间间隔的图像,所述预测移动场表征图像中像素点的位置变化预测情况;
将所述预测移动场、所述视频数据的最后一帧图像和预设矩阵输入形变网络,得到异常矩阵和下一时刻的参考预测图像;所述预设矩阵与所述视频数据中的图像具有相同维度,所述异常矩阵表征参考预测图像中发生异常移动的像素点位置;
将所述异常矩阵和所述参考预测图像输入图像生成网络,得到下一时刻的预测图像;将所述预测图像添加至所述视频数据的最后一帧图像位置之后,删除所述视频数据的第一帧图像,形成新的视频数据,并返回执行将视频数据输入移动场预测网络的步骤,直至得到预设帧数的预测图像,作为预测视频数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述预测移动场、所述视频数据的最后一帧图像和预设矩阵输入形变网络,得到异常矩阵和下一时刻的参考预测图像,包括:
通过所述形变网络对所述预测移动场和所述视频数据的最后一帧图像进行预测处理,得到下一时刻的参考预测图像;
通过所述形变网络对所述预测移动场和所述预设矩阵进行变换处理,得到所述异常矩阵。
3.根据权利要求2所述的方法,其特征在于,所述通过所述形变网络对所述预测移动场和所述预设矩阵进行变换处理,得到所述异常矩阵,包括:
将所述预测移动场和所述预设矩阵输入所述形变网络,输出变换矩阵;
根据所述变换矩阵中各位置的值,确定所述异常矩阵。
4.根据权利要求1所述的方法,其特征在于,所述将所述异常矩阵和所述参考预测图像输入图像生成网络,得到下一时刻的预测图像,包括:
将所述异常矩阵和所述参考预测图像进行通道连接后输入所述图像生成网络,得到下一时刻的预测图像。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
获取样本视频数据;
将所述样本视频数据输入初始移动场预测网络,得到样本移动场;
将所述样本移动场、所述样本视频数据的最后一帧图像和预设矩阵输入初始形变网络,得到样本异常矩阵和下一时刻的参考样本预测图像;
将所述样本异常矩阵和所述参考样本预测图像输入初始图像生成网络,得到下一时刻的样本预测图像;
根据所述样本异常矩阵、所述样本视频数据对应的下一时刻真实图像、所述样本预测图像和所述样本移动场计算损失函数,根据所述损失函数对所述初始移动场预测网络、所述初始形变网络和所述初始图像生成网络进行训练。
6.根据权利要求5所述的方法,其特征在于,所述根据所述样本异常矩阵、所述样本视频数据对应的下一时刻真实图像、所述样本预测图像和所述样本移动场计算损失函数,包括:
根据包含:
的关系式计算所述损失函数;
其中,所述M为所述样本异常矩阵,所述T为所述下一时刻真实图像,所述为所述样本预测图像,所述wt(x)为所述样本移动场,所述MSE为均方误差函数,所述α、λ1、λ2、λ3为权重因子。
7.根据权利要求1所述的方法,其特征在于,所述图像生成网络为包括跳跃连接的卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010564352.5/1.html,转载请声明来源钻瓜专利网。