首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]生成虚拟人物视频的方法、装置、设备和计算机存储介质在审

申请号：	202010962994.0	申请日：	2020-09-14
公开（公告）号：	CN112233210A	公开（公告）日：	2021-01-15
发明（设计）人：	李彤辉;胡天舒;马明明;洪智滨	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06T13/20	分类号：	G06T13/20;G06T13/40;G10L25/48;G10L25/78
代理公司：	北京鸿德海业知识产权代理有限公司 11412	代理人：	田宏宾
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	生成虚拟人物视频方法装置设备计算机存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种生成虚拟人物视频的方法，包括：

将语音按照预设时长进行切分，得到n个语音段，所述n为正整数；

按照时间顺序，分别对各语音段进行静音识别和虚拟人物预测得到各语音段对应的图像帧序列，并将各语音段以及语音段对应的图像帧序列发送至终端的队列，以便所述终端逐一从所述队列中获取语音段及语音段对应的图像帧序列进行合成，并播放合成的虚拟人物视频。

2.根据权利要求1所述的方法，其中，所述切分、所述静音识别、所述虚拟人物预测和所述发送的处理由服务器端执行；

所述语音为所述服务器端对文本进行语音合成后得到的语音，或者，在语音库中查询得到的文本对应的语音。

3.根据权利要求1所述的方法，其中，所述切分、所述静音识别、所述虚拟人物预测和所述发送的处理由所述终端执行；

所述语音为服务器端对文本进行语音合成后发送给所述终端的语音，或者，所述终端向服务器端的语音库查询得到的文本对应的语音。

4.根据权利要求1所述的方法，其中，对语音段进行静音识别和虚拟人物预测得到语音段对应的图像帧序列包括：

识别所述语音段中的静音部分和语音部分；

对所述语音部分进行虚拟人物预测，所述虚拟人物预测包括动作预测和/或唇形预测，得到所述语音部分对应的动作序列和唇形图像序列；

将虚拟人物底板图像、所述语音部分对应的动作序列和唇形图像序列按照所述语音段中对应的时间点进行合成，得到所述语音段对应的图像帧序列。

5.根据权利要求4所述的方法，其中，所述将虚拟人物底板图像、所述语音部分对应的动作序列和唇形图像序列按照所述语音段中对应的时间点进行合成包括：

对于语音段中静音部分的各时间点采用所述虚拟人物底板图像分别作为各时间点的图像帧；

对于语音段中语音部分的各时间点，将各时间点对应的动作和唇形图像合成至所述虚拟人物底板图像分别作为各时间点的图像帧；

按照各时间点的顺序，由各时间点的图像帧构成所述语音段对应的图像帧序列。

6.根据权利要求1所述的方法，在针对语音段进行虚拟人物预测后，还包括：

保存针对该语音段进行虚拟人物预测的状态数据，以用于下一语音段进行虚拟人物预测的初始输入，所述状态数据包括该语音段所包含最后一个字的序号以及该语音段对应的图像帧序列的最后一帧。

7.一种生成虚拟人物视频的装置，包括：

语音切分模块，用于将语音按照预设时长进行切分，得到n个语音段，所述n为正整数；

图像预测模块，用于按照时间顺序，分别对各语音段进行静音识别和虚拟人物预测得到各语音段对应的图像帧序列，并将各语音段以及语音段对应的图像帧序列发送至终端的队列，以便所述终端逐一从所述队列中获取语音段及语音段对应的图像帧序列进行合成，并播放合成的虚拟人物视频。

8.根据权利要求7所述的装置，所述装置设置于服务器端；

所述语音为所述服务器端对文本进行语音合成后得到的语音，或者，在语音库中查询得到的文本对应的语音。

9.根据权利要求7所述的装置，所述装置设置于终端；

所述语音为服务器端对文本进行语音合成后发送给所述终端的语音，或者，所述终端向服务器端的语音库查询得到的文本对应的语音；

所述装置还包括：

视频合成模块，用于逐一从所述队列中获取语音段及语音段对应的图像帧序列进行合成；

视频播放模块，用于播放所述视频合成模块合成的虚拟人物视频。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010962994.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种金属材料倾斜表面处理设备
下一篇：一种使玉米棒与玉米粒快速有效分离的脱粒装置

同类专利

专利分类

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T13-00 动画制作
G06T13-20 .3D［三维］动画
G06T13-80 .2D［二维］动画，如使用精灵sprites
G06T13-40 ..关于角色的，例如：人类、动物或虚幻人物
G06T13-60 ..关于自然景观的，例如：雨、雪、水或植物

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top