[发明专利]视频预测方法和装置、视频预测模型的训练方法及车辆在审
申请号: | 201910610206.9 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110334654A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 范坤 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 秦卫中 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 帧图像 视频预测 特征图 方法和装置 空间特征 时间特征 运算负担 资源占用 不连续 时间段 视频帧 预测 减小 申请 | ||
1.一种视频预测方法,包括:
确定先前N帧图像的第N特征图,其中,所述第N特征图包含所述先前N帧图像的空间特征和时间特征;
根据所述第N特征图生成未来M帧图像,其中,所述未来M帧图像与所述先前N帧图像之间间隔P帧图像,N为大于1的整数,M、P为大于或等于1的整数。
2.根据权利要求1所述的方法,其中,所述确定先前N帧图像的第N特征图,包括:
确定所述先前N帧图像中的每帧图像的第一空间特征图,其中所述第一空间特征图包含所述每帧图像的空间特征;
基于所述先前N帧图像中与第n-1帧图像对应的第n-1特征图以及第n帧图像的第一空间特征图,确定所述第n特征图,其中,n为大于1且小于或等于N-1的整数;
基于所述先前N帧图像中与第N-1帧图像对应的第N-1特征图以及第N帧图像的第一空间特征图,确定所述第N特征图。
3.根据权利要求2所述的方法,其中,所述确定先前N帧图像中的每帧图像的第一空间特征图的步骤通过执行神经网络的卷积层的卷积运算来执行,所述确定所述第n特征图以及所述确定所述第N特征图的步骤通过执行所述神经网络的卷积-长短期记忆层的卷积运算来执行。
4.根据权利要求1所述的方法,其中,所述根据所述第N特征图生成未来M帧图像,包括:
根据空白帧图像确定所述空白帧图像的第一空间特征图;
根据所述第N特征图和所述空白帧图像的第一空间特征图确定所述未来M帧图像中的第1帧图像的第二空间特征图;
根据所述第二空间特征图生成所述未来M帧图像中的第1帧图像;
根据所述未来M帧图像中的第m-1帧图像生成第m帧图像,其中,m为大于1且小于或等于M的整数。
5.根据权利要求4所述的方法,其中,所述根据空白帧图像确定所述空白帧图像的第一空间特征图的步骤通过执行神经网络的卷积层的卷积运算来执行,所述根据所述第N特征图和所述空白帧图像的第一空间特征图确定所述未来M帧图像中的第1帧图像的第二空间特征图的步骤通过执行所述神经网络的卷积-长短期记忆层的卷积运算来执行,所述根据所述第二空间特征图生成所述未来M帧图像中的第1帧图像的步骤通过执行所述神经网络的反卷积层的反卷积运算来执行。
6.一种视频预测模型的训练方法,包括:
通过利用多个样本视频训练机器学习模型得到所述视频预测模型,所述多个样本视频中的每个样本视频包括先前N帧样本图像和未来M帧样本图像,所述未来M帧样本图像和所述先前N帧样本图像之间间隔P帧图像,其中,N为大于1的整数,M、P为大于或等于1的整数。
7.一种视频预测装置,包括:
确定模块,用于确定先前N帧图像的第N特征图,其中,所述第N特征图包含所述先前N帧图像的空间特征和时间特征;
生成模块,用于根据所述第N特征图生成未来M帧图像,其中,所述未来M帧图像与所述先前N帧图像之间间隔P帧图像,N为大于1的整数,M、P为大于或等于1的整数。
8.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1至5中任一项所述的视频预测方法。
9.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器,
其中,所述处理器用于执行上述权利要求1至5中任一项所述的视频预测方法。
10.一种车辆,包括权利要求9所述的电子设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910610206.9/1.html,转载请声明来源钻瓜专利网。