[发明专利]对象直播展示方法和装置、存储介质及电子设备在审
申请号: | 202111408833.8 | 申请日: | 2021-11-19 |
公开(公告)号: | CN114173142A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 陈耀君;蔡海军 | 申请(专利权)人: | 广州繁星互娱信息科技有限公司 |
主分类号: | H04N21/2187 | 分类号: | H04N21/2187;H04N21/233;H04N21/234;H04N21/431;H04N21/44;H04N21/472 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 510000 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 直播 展示 方法 装置 存储 介质 电子设备 | ||
1.一种对象直播展示方法,其特征在于,包括:
获取对主播对象采集到的第一视频,其中,在所述第一视频中包括所述主播对象根据所播放的目标音频执行的目标动作序列;
对所述目标音频的音频特征及所述目标动作序列的目标动作特征进行拼接,以得到参考动作特征;
基于所述参考动作特征生成参考动作序列的动作参数;
控制为所述主播对象匹配的虚拟角色按照所述动作参数执行所述参考动作序列,以生成第二视频;
将所述第一视频及所述第二视频推送给播放客户端进行展示,其中,所述播放客户端为与所述主播对象的主播账号关联的观众账号所登录的客户端。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标音频的音频特征及所述目标动作序列的目标动作特征进行拼接,以得到参考动作特征包括:
从所述第一视频中分割出所述目标音频的音频数据,及包含所述目标动作序列的画面数据;
从所述音频数据中提取出所述目标音频的音频特征,并从所述画面数据中提取所述目标动作序列的动作特征;
对所述音频特征及所述目标动作特征进行拼接,以得到所述参考动作特征。
3.根据权利要求2所述的方法,其特征在于,
所述从所述音频数据中提取出所述目标音频的音频特征包括:提取所述目标音频的风格特征、节拍特征及频谱特征;
所述从所述画面数据中提取所述目标动作序列的动作特征包括:从所述画面数据中提取所述目标动作序列中每个目标动作各自对应的关键点特征集,其中,所述关键点特征集中包括所述主播对象执行所述目标动作时各个关键部位对应的关键点特征;
将所述关键点特征集确定为所述目标动作特征。
4.根据权利要求2所述的方法,其特征在于,所述对所述音频特征及所述目标动作特征进行拼接,以得到所述参考动作特征包括:
将所述目标音频的第i帧的所述音频特征,与第i帧的所述目标动作特征进行拼接,得到第i帧的所输出参考动作特征,其中,所述第一视频包括N帧,i为大于等于1,且小于等于N的整数。
5.根据权利要求3所述的方法,其特征在于,在所述控制为所述主播对象匹配的虚拟角色按照所述动作参数执行所述参考动作序列,以生成第二视频之前,还包括:
获取为所述主播对象匹配的所述虚拟角色;
为所述虚拟角色确定与所述目标音频的风格特征相匹配的外观样式。
6.根据权利要求1所述的方法,其特征在于,所述基于所述参考动作特征生成参考动作序列的动作参数包括:
将所述参考动作特征输入目标动作匹配模型中,以得到所述参考动作序列的动作参数,其中,所述目标动作匹配模型是基于多个样本动作视频训练后得到的用于生成动作参数的神经网络模型。
7.根据权利要求6所述的方法,其特征在于,所述将所述参考动作特征输入目标动作匹配模型中,以得到所述参考动作序列的动作参数之前,包括:
获取所述多个样本动作视频,其中,所述样本动作视频中包括至少两个对象根据同一个音频执行的动作序列;
利用所述多个样本动作视频对初始动作匹配模型进行训练,直至达到第一收敛条件;
将达到所述第一收敛条件的动作匹配模型作为所述目标动作匹配模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州繁星互娱信息科技有限公司,未经广州繁星互娱信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111408833.8/1.html,转载请声明来源钻瓜专利网。