[发明专利]基于语音的口型动画合成装置、方法及可读存储介质有效

申请号：	201810327672.1	申请日：	2018-04-12
公开（公告）号：	CN108763190B	公开（公告）日：	2019-04-02
发明（设计）人：	梁浩;王健宗;肖京	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F17/27	分类号：	G06F17/27;G06N3/08;G06T13/20;G10L13/02;G10L15/02;G10L15/16;G10L25/24;G10L25/30
代理公司：	深圳市沃德知识产权代理事务所(普通合伙) 44347	代理人：	高杰;于志光
地址：	518000 广东省深***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于语音的口型动画合成装置，包括存储器和处理器，存储器上存储有可在处理器上运行的口型动画合成程序，该程序被处理器执行时实现如下步骤：获取目标文本数据，根据发音词典获取目标文本数据中的音素特征；将音素特征输入到预先训练好的深度神经网络模型中，输出声学特征，将声学特征输入到语音合成器中输出语音数据；根据语音数据、预先训练好的张量模型以及说话人标识信息，获取口型数据；根据口型数据生成与语音数据对应的口型动画。发明还提出一种基于语音的口型动画合成方法以及一种计算机可读存储介质。本发明解决了现有技术中无法展示与合成的语音数据匹配的、并具有真实感的口型动画的技术问题。
搜索关键词：	口型动画语音数据合成装置获取目标口型数据声学特征文本数据音素特征存储器语音处理器计算机可读存储介质合成可读存储介质神经网络模型处理器执行语音合成器标识信息发音词典合成程序输出语音真实感匹配存储输出展示
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于语音的口型动画合成装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的口型动画合成程序，所述口型动画合成程序被所述处理器执行时实现如下步骤：获取目标文本数据，根据发音词典获取所述目标文本数据中的音素特征；将所述音素特征输入到预先训练好的深度神经网络模型中，输出与所述音素特征对应的声学特征，所述声学特征包括梅尔倒谱系数MFCC特征、发音时长和发音基频；将所述声学特征输入到语音合成器中，输出与所述目标文本数据对应的语音数据；根据所述语音数据、预先训练好的张量模型以及预先设置的说话人标识信息，获取与所述语音数据和所述说话人标识信息对应的口型数据，所述张量模型表达语音数据的发音特征与口型数据的口型位置特征之间的相关关系；根据所述口型数据生成与所述语音数据对应的口型动画，以供在播放所述语音数据的同时，展示所述口型动画。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于平安科技（深圳）有限公司，未经平安科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810327672.1/，转载请声明来源钻瓜专利网。

上一篇：一种直播间内容标签权重计算方法、装置及电子设备
下一篇：一种文本摘要生成方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于语音的口型动画合成装置、方法及可读存储介质有效

专利文献下载