[发明专利]一种虚拟主播角色模型和语音数据叠加摄录视频系统有效

申请号：	202211114839.9	申请日：	2022-09-14
公开（公告）号：	CN115187708B	公开（公告）日：	2022-11-15
发明（设计）人：	张卫平;黄筱雨;丁烨;张思琪;张伟;李显阔;李蕙男	申请（专利权）人：	环球数科集团有限公司
主分类号：	G06T13/40	分类号：	G06T13/40;G06T13/20;G06T13/80;H04N5/76;H04N5/91
代理公司：	北京清控智云知识产权代理事务所(特殊普通合伙) 11919	代理人：	林淡如
地址：	518063 广东省深圳市南山区粤海街道高新***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种虚拟角色模型语音数据叠加摄录视频系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种虚拟主播角色模型和语音数据叠加摄录视频系统，其特征在于，包括动作采集模块、音频采集模块、场景数据库、分析合成模块和拍摄模块，所述动作采集模块用于采集真人的动作数据，所述音频采集模块用于采集真人的音频数据，所述场景数据库用于保存三维场景数据，所述分析合成模块根据所述动作数据和所述音频数据使虚拟模型产生运动，所述拍摄模块用于在三维场景中对运动的虚拟模型进行拍摄，并结合音频数据输出完整的音像数据；

所述分析合成模块包括音频预处理单元、矢量处理单元和模型动作单元，所述音频预处理单元用于对音频数据处理得到发音数据，所述矢量处理单元用于将发音数据处理成矢量加载数据组，所述模型动作单元根据所述矢量加载数据组使虚拟模型产生运动；

虚拟模型中包括口型节点和肢体节点，所述口型节点运行所述矢量处理单元得到的矢量加载数据组后产生口型运动，所述肢体节点运行所述动作采集模块采集的矢量加载数据组后产生肢体运动；

所述矢量加载数据组用或表示，其中，表示口型节点，表示肢体节点，为动作矢量，j为动作矢量在矢量加载数据组中的序号，为平面角，为俯仰角，为移动距离，为动作时长；

所述拍摄模块从所述场景数据库中获取三维场景，并将虚拟主播模型加载到三维场景中，当所述模型动作单元运行矢量加载数据组时启动虚拟镜头开启录制，所述虚拟镜头将拍摄到的平面图像输出为视频数据，所述拍摄模块将视频数据与音频数据合并后得到完整的音像数据。

2.如权利要求1所述的一种虚拟主播角色模型和语音数据叠加摄录视频系统，其特征在于，所述音频预处理单元内设有发音特征参数表，所述音频预处理单元根据所述发音特征参数表将音频数据中的对应片段转换成实音数据，实音数据对应音频片段为目标音频，所述音频预处理单元将目标音频之间的音频片段转换成缓冲数据，所述实音数据和所述缓冲数据统称为发音数据，所述发音数据用表示，A为缓冲编码或发音编码，t为对应音频片段的时长。

3.如权利要求2所述的一种虚拟主播角色模型和语音数据叠加摄录视频系统，其特征在于，所述矢量处理单元内设有编码矢量对照表，所述矢量对照表中包括发音编码、口型节点、口型矢量和复原矢量，一个发音编码对应多个口型节点，一个口型节点对应一组口型矢量和一个复原矢量，所述矢量处理单元将每个一个发音数据根据所述编码矢量对照表处理成一个动作矢量。

4.如权利要求3所述的一种虚拟主播角色模型和语音数据叠加摄录视频系统，其特征在于，所述口型矢量用表示，其中，为时长比例，所述矢量处理单元根据实音数据中的发音编码A从所述编码矢量对照表中获取口型矢量，并将时长比例与实音数据中的t相乘后得到实音数据的动作矢量；

所述复原矢量用表示，所述矢量处理单元根据缓冲数据获取前一个实音数据的复原矢量，将缓冲数据中的时间t添加到复原矢量中得到缓冲数据的动作矢量。

5.如权利要求4所述的一种虚拟主播角色模型和语音数据叠加摄录视频系统，其特征在于，所述口型节点的复原矢量通过下式计算得到并记录在编码矢量对照表中：

；

其中，、和分别为第k个口型矢量中的平面角、俯仰角和移动距离，m为该口型节点中口型矢量的数量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于环球数科集团有限公司，未经环球数科集团有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211114839.9/1.html，转载请声明来源钻瓜专利网。