[发明专利]语音合成方法、装置、计算机设备及存储介质在审
申请号: | 201910602385.1 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110459200A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 向纯玉 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L15/02;G10L15/06;G10L15/08;G10L15/25;G06K9/00 |
代理公司: | 44325 深圳众鼎专利商标代理事务所(普通合伙) | 代理人: | 周燕君<国际申请>=<国际公布>=<进入 |
地址: | 518000广东省深圳市前海深港合作区前湾*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人脸图片 标签 声学模型 语音特征参数 视频 人脸特征 人脸 计算机设备 存储介质 语音标签 语音合成 准确率 语音 合成 角色 | ||
1.一种语音合成方法,其特征在于,包括:
获取待配音视频中的人脸图片;
提取所述人脸图片的人脸特征;
根据所述人脸特征确定所述待配音视频中的人脸图片对应的人脸标签;
从声学模型库中选取所述人脸标签对应的声学模型,所述声学模型包括多个语音标签;
确定多个所述语音标签中每个所述语音标签对应的语音特征参数;
采用每个所述语音标签对应的语音特征参数为所述待配音视频中的人脸图片对应的角色合成语音。
2.如权利要求1所述的语音合成方法,其特征在于,通过如下步骤获取所述声学模型库:
获取多个人脸样本和所述多个人脸样本对应的多个语音样本;
提取所述人脸样本的人脸特征;
确定所述人脸特征对应的人脸标签;
提取所述语音样本的语音特征,所述语音特征包括多个语音特征参数;
确定多个所述语音特征参数对应的多个语音标签;
根据多个所述人脸标签和多个所述语音标签生成所述声学模型库。
3.如权利要求2所述的语音合成方法,其特征在于,所述根据多个所述人脸标签和多个所述语音标签生成所述声学模型库,包括:
对多个所述人脸样本对应的所述人脸标签以及所述语音标签的数量进行统计,以获取所述人脸标签与所述语音标签的关联性,所述关联性用于匹配每类所述人脸标签对应出现概率最大的所述语音标签;
根据所述关联性确定每个所述人脸标签所对应的语音标签;
根据所述每个人脸标签所对应的语音标签,生成所述人脸标签对应的声学模型;
根据所有所述人脸标签对应的声学模型生成所述声学模型库。
4.如权利要求2所述的语音合成方法,其特征在于,所述提取所述人脸样本的人脸特征,包括:
从每一所述人脸样本中提取出多个外轮廓特征点和多个五官特征点;
将每一所述人脸样本所有所述外轮廓特征点进行连接,得到所述人脸图像的外轮廓;
将每一所述人脸样本的所有相同五官类型的五官特征点进行连接,得到所述人脸图像的各个五官对应的五官轮廓;
将每一所述人脸样本的所述外轮廓和所述各个五官的轮廓作为所述人脸样本对应的所述人脸特征。
5.如权利要求4所述的语音合成方法,其特征在于,所述确定所述人脸特征对应的人脸标签,包括:
计算所述人脸样本的所述外轮廓的弧度;
根据各个所述五官轮廓,计算各个五官之间的间距、各个五官的长度和宽度;
根据所述外轮廓的弧度和所述各个五官之间的间距、各个五官的长度和宽度,确定所述人脸特征对应的人脸标签。
6.一种语音合成装置,其特征在于,包括:
第一获取模块,用于获取待配音视频中的人脸图片;
第一提取模块,用于提取所述人脸图片的人脸特征;
第一确定模块,用于根据所述人脸特征确定所述待配音视频中的人脸图片对应的人脸标签;
选取模块,用于从声学模型库中选取所述人脸标签对应的声学模型,所述声学模型包括多个语音标签;
第二确定模块,用于确定多个所述语音标签中每个所述语音标签对应的语音特征参数;
合成模块,用于采用每个所述语音标签对应的语音特征参数为所述待配音视频中的人脸图片对应的角色合成语音。
7.如权利要求6所述的语音合成装置,其特征在于,通过如下模块获取所述声学模型库:
第二获取模块,用于获取多个人脸样本和所述多个人脸样本对应的多个语音样本;
第二提取模块,用于提取所述人脸样本的人脸特征;
第三确定模块,用于确定所述人脸特征对应的人脸标签;
第三提取模块,用于提取所述语音样本的语音特征,所述语音特征包括多个语音特征参数;
第四确定模块,用于确定多个所述语音特征参数对应的多个语音标签;
生成模块,用于根据多个所述人脸标签和多个所述语音标签生成所述声学模型库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910602385.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:雕刻机的降噪方法及雕刻机
- 下一篇:一种产生新音色的语音合成方法