[发明专利]三维人脸的唇动控制方法、设备和介质在审
申请号: | 202110221201.4 | 申请日: | 2021-02-26 |
公开(公告)号: | CN113035198A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 郭紫垣;赵亚飞;陈超;张世昌 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G06K9/00;G06F40/289 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维 控制 方法 设备 介质 | ||
1.一种三维人脸的唇动控制方法,包括:
对目标语音相应的文本进行切分,得到一个或多个字;
基于目标语音的音色特征,从向量库中获取所述一个或多个字中每一个字相应的第一向量,所述向量库包括与每一个字相应的不同于第一向量的第二向量;
至少基于所述一个或多个字相应的一个或多个第一向量,确定与所述目标语音相应的目标混合系数;以及
至少基于所述目标混合系数控制所述三维人脸的唇动,以使得所述三维人脸的唇动适配所述目标语音。
2.根据权利要求1所述的方法,其中,所述向量库包括多个向量盒,每一个向量盒包括多个字和多个向量之间的相应关系,所述多个向量盒中与同一个字相应的向量不同。
3.根据权利要求2所述的方法,其中,基于目标语音的音色特征,从向量库中获取所述目标语音中每一个字相应的第一向量包括:
基于目标语音的音色特征,从所述多个向量盒中确定所述目标语音对应的目标向量盒;
从所述目标向量盒中获取所述目标语音中每一个字相应的第一向量。
4.根据权利要求3所述的方法,其中,所述目标语音为目标用户的语音,
其中,基于目标语音的音色特征,从所述多个向量盒中确定所述目标语音对应的目标向量盒包括:
获取所述目标用户的预设语音,所述预设语音能够表征所述目标语音的音色特征;
从所述向量库的至少一部分向量盒中的每一个向量盒中获取所述预设语音对应的预设向量;
针对从至少一部分向量盒中所获取的多个预设向量,确定与每一个预设向量相应的预设混合系数;
基于与所述多个预设向量相应的多个预设混合系数分别对所述三维人脸进行唇动控制;
基于所述三维人脸的针对多个预设向量的唇动,确定其中一个预设向量所在的向量盒为所述目标向量盒。
5.根据权利要求4所述的方法,其中,所述预设语音为爆破音语音、闭口音语音或张口音语音。
6.根据权利要求2所述的方法,其中,所述目标语音为目标用户的语音,并且所述方法还包括:
存储所述向量库中向量盒和用户之间的对应关系,
其中,基于目标语音的音色特征,从向量库中获取所述目标语音中每一个字相应的第一向量包括:
响应于基于所述对应关系确定所述向量库中包括与所述目标用户对应的目标向量盒,从所述目标向量盒中获取所述目标语音中每一个字相应的第一向量。
7.根据权利要求6所述的方法,还包括:
响应于基于所述对应关系确定所述向量库中不包括与所述目标用户对应的目标向量盒,基于目标语音的音色特征,从所述向量盒中确定所述目标语音对应的目标向量盒;以及
存储所述向量库中所述目标向量盒和所述目标用户之间的对应关系。
8.根据权利要求1所述的方法,其中,至少基于所述一个或多个字相应的一个或多个向量,确定与所述目标语音相应的目标混合系数包括:
至少将所述一个或多个字相应的一个或多个向量输入唇动模型,获取所述唇动模型所输出的与所述目标语音相应的目标混合系数。
9.根据权利要求1-8中任一项所述的方法,还包括:
获取所述目标语音的目标用户的声音特征,
其中,至少基于所述一个或多个字相应的一个或多个向量,确定与所述目标语音相应的目标混合系数包括:
基于所述一个或多个字相应的一个或多个向量,以及所述目标用户的声音特征,确定与所述目标语音相应的目标混合系数。
10.根据权利要求9所述的方法,其中,获取所述目标用户的声音特征包括:
存储多个用户与多个声音特征之间的对应关系;
基于所存储的用户与声音特征之间的对应关系,查找所述目标用户的声音特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110221201.4/1.html,转载请声明来源钻瓜专利网。