[发明专利]针对目标说话人的语音合成方法和装置有效
申请号: | 201810322979.2 | 申请日: | 2018-04-11 |
公开(公告)号: | CN110379411B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 黄智颖;卢恒;雷鸣;王玉平 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/07;G10L15/16;G06N99/00 |
代理公司: | 北京君以信知识产权代理有限公司 11789 | 代理人: | 谭镇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种针对目标说话人的语音合成方法和装置。该方法包括:获取第一发音特征向量并输入声学模型组件;利用所述声学模型组件对所述第一发音特征向量进行处理,获得声学特征;其中所述声学模型组件包括基础机器学习模型组件和特征机器学习模型组件,特征机器学习模型组件是利用目标说话人的语音训练获得的;基于声学特征合成针对目标说话人的语音数据。该语音合成方法和装置利用插入的机器学习模型组件作为反映目标说话人的特征的模型组件,通过组合该基础机器学习模型组件和该特征机器学习模型组件形成声学模型组件,将输入的发音特征向量转换为声学特征,减少了目标说话人需要的训练语句的数量,提高了训练模型组件的速度。 | ||
搜索关键词: | 针对 目标 说话 语音 合成 方法 装置 | ||
【主权项】:
1.一种针对目标说话人的语音合成方法,其特征在于,包括:获取第一发音特征向量并输入声学模型组件;利用所述声学模型组件对所述第一发音特征向量进行处理,获得声学特征;其中所述声学模型组件包括基础机器学习模型组件和特征机器学习模型组件,所述特征机器学习模型组件是利用所述目标说话人的语音样本数据训练获得的;基于所述声学特征合成针对目标说话人的语音数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810322979.2/,转载请声明来源钻瓜专利网。