[发明专利]视频的生成方法、装置及设备在审
申请号: | 201911215644.1 | 申请日: | 2019-12-02 |
公开(公告)号: | CN112995530A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 侯飞跃;刘帅;敖梦星 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04N5/262 | 分类号: | H04N5/262;H04N21/44;H04N21/435;H04N21/439;H04N21/81 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 孙明子;刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 设备 | ||
1.一种视频的生成方法,其特征在于,包括:
获取待播报信息;
确定与所述待播报信息相对应的数据对象的形象;
根据所述待播报信息确定与所述数据对象的形象相对应的面部表情参数;
利用所述面部表情参数驱动所述数据对象的形象进行动作,生成与所述待播报信息相对应的视频。
2.根据权利要求1所述的方法,其特征在于,确定与所述待播报信息相对应的数据对象的形象,包括:
获取用户针对预设的多个播报形象输入的执行操作;
根据所述执行操作在多个播报形象中确定与所述待播报信息相对应的数据对象的形象。
3.根据权利要求1所述的方法,其特征在于,确定与所述待播报信息相对应的数据对象的形象,包括:
获取用户输入的形象配置参数;
根据所述形象配置参数生成与所述待播报信息相对应的数据对象的形象。
4.根据权利要求1所述的方法,其特征在于,在确定与所述待播报信息相对应的数据对象的形象之后,所述方法还包括:
确定所述数据对象的形象的姿态信息;
控制所述数据对象的形象以所确定的姿态信息在所述视频中进行显示。
5.根据权利要求1所述的方法,其特征在于,所述待播报信息包括以下至少之一:待播报文本、待播报语音。
6.根据权利要求5所述的方法,其特征在于,根据所述待播报信息确定与所述数据对象的形象相对应的面部表情参数,包括:
将所述待播报信息转换为相对应的预设语音信息;
基于所述预设语音信息生成与数据对象的形象相对应的面部表情参数。
7.根据权利要求6所述的方法,其特征在于,所述面部表情参数包括以下至少之一:嘴型参数、眼睛参数、脸部参数。
8.根据权利要求7所述的方法,其特征在于,基于所述预设语音信息生成与数据对象的形象相对应的面部表情参数,包括:
获取与所述预设语音信息相对应的振幅信息;
根据所述振幅信息生成与所述数据对象的形象相对应的嘴型参数。
9.根据权利要求5所述的方法,其特征在于,在所述待播报信息包括待播报语音时,利用所述面部表情参数驱动所述数据对象的形象进行动作,生成与所述待播报信息相对应的视频,包括:
根据所述待播报语音确定与所述数据对象的形象相对应的声音参数;
利用所述面部表情参数和声音参数驱动所述数据对象的形象进行动作,生成与所述待播报信息相对应的视频。
10.根据权利要求1-9中任意一项所述的方法,其特征在于,利用所述面部表情参数驱动所述数据对象的形象进行动作,生成与所述待播报信息相对应的视频,包括:
获取视频背景信息;
在所述视频背景信息中,利用所述面部表情参数驱动所述数据对象的形象进行动作,生成与所述待播报信息相对应的视频。
11.根据权利要求10所述的方法,其特征在于,获取视频背景信息,包括:
获取用户针对预设的多个视频背景输入的执行操作;
根据所述执行操作在多个视频背景中确定所述视频背景信息。
12.根据权利要求1-9中任意一项所述的方法,其特征在于,在生成与所述待播报信息相对应的视频之后,所述方法还包括:
对所述视频中的相邻视频帧进行相似度识别;
在相似度大于或等于预设阈值时,则确定在相邻视频帧之间不需要转场音视频;或者,
在相似度小于预设阈值时,则确定在相邻视频帧之间需要转场音视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911215644.1/1.html,转载请声明来源钻瓜专利网。