[发明专利]生成视频的方法,装置,存储介质及电子设备有效
申请号: | 201910557145.4 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110381268B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 王超鹏;林义闽;廉士国 | 申请(专利权)人: | 达闼机器人有限公司 |
主分类号: | H04N5/265 | 分类号: | H04N5/265;G06T7/50;G06T7/10;G06T3/00;G06T5/00 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 曾尧 |
地址: | 201111 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种生成视频的方法,装置,存储介质及电子设备。该方法包括:将源视图的三原色图像输入深度及语义网络,得到所述深度及语义网络输出的深度图以及语义图;将所述语义图以及三原色图像输入特征编码器网络,得到特征编码器网络输出的特征图;针对源视图的多个连续的位姿变换矩阵中的每一位姿变换矩阵,根据该位姿变换矩阵与深度图,对语义图和特征图分别进行变换,得到对应于每一位姿变换矩阵的目标语义图和目标特征图;根据对应于每一位姿变换矩阵的目标语义图和目标特征图,分别生成图像帧,得到多个连续的图像帧;将多个连续的图像帧合成为视频。如此,可以使生成的图像帧更加清晰和逼真,从而使生成的视频更加逼真。 | ||
搜索关键词: | 生成 视频 方法 装置 存储 介质 电子设备 | ||
【主权项】:
1.一种生成视频的方法,其特征在于,所述方法包括:将源视图的三原色图像输入深度及语义网络,得到所述深度及语义网络输出的深度图以及语义图;将所述语义图以及所述三原色图像输入特征编码器网络,得到所述特征编码器网络输出的特征图;针对所述源视图的多个连续的位姿变换矩阵中的每一位姿变换矩阵,根据该位姿变换矩阵与所述深度图,对所述语义图和所述特征图分别进行变换,得到对应于每一所述位姿变换矩阵的目标语义图和目标特征图,所述多个连续的位姿变换矩阵是所述源视图相对于多个连续的图像帧的分别的位姿变换矩阵;根据对应于每一所述位姿变换矩阵的目标语义图和目标特征图,分别生成图像帧,得到多个连续的图像帧,其中,每一所述图像帧和所述源视图是同一对象不同视角的图像;将所述多个连续的图像帧合成为视频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达闼机器人有限公司,未经达闼机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910557145.4/,转载请声明来源钻瓜专利网。