[发明专利]语音转换与模型训练方法、装置和系统及存储介质在审

专利信息
申请号: 202011054910.X 申请日: 2020-09-29
公开(公告)号: CN112185342A 公开(公告)日: 2021-01-05
发明(设计)人: 武剑桃;李秀林 申请(专利权)人: 标贝(北京)科技有限公司
主分类号: G10L13/033 分类号: G10L13/033;G10L13/08;G10L15/06;G10L15/07;G10L21/003;G10L25/03;G10L25/24;G10L25/30;G06N3/04;G06N3/08
代理公司: 北京睿邦知识产权代理事务所(普通合伙) 11481 代理人: 徐丁峰;戴亚南
地址: 100192 北京市海淀区西小口路66号中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 转换 模型 训练 方法 装置 系统 存储 介质
【权利要求书】:

1.一种语音转换方法,包括:

获取源说话者分别在N个不同通道下的N组源语音数据,其中,N为大于1的整数;

分别对所述N组源语音数据中的每组源语音数据进行特征提取,以获得N组源识别声学特征;

对所述N组源识别声学特征进行特征合并,以获得所述源说话者的声学特征;

通过预定映射模型将所述源说话者的声学特征映射为目标说话者的声学特征;

基于所述目标说话者的声学特征进行语音合成,以获得所述目标说话者的目标语音。

2.根据权利要求1所述的语音转换方法,其中,所述获取源说话者分别在N个不同通道下的N组源语音数据包括:

获取麦克风阵列采集的所述源说话者的所述N组源语音数据,所述麦克风阵列包括与所述N个不同通道一一对应的N个布置方位不同的麦克风。

3.根据权利要求1所述的语音转换方法,其中,所述获取源说话者分别在N个不同通道下的N组源语音数据包括:

获取M个麦克风采集的所述源说话者的M组初始源语音数据,其中,M为大于或等于1的整数;以及

对所述M组初始源语音数据进行M通道至N通道的通道变换操作,以获得所述N组源语音数据。

4.一种模型训练方法,包括:

获取样本说话者的第一训练语音数据以及目标说话者的第二训练语音数据;

对所述第一训练语音数据进行单通道至N通道的通道变换操作,以获得分别在N个不同通道下的N组样本语音数据,其中,N为大于1的整数;

分别对所述N组样本语音数据中的每组样本语音数据进行特征提取,以获得N组第一识别声学特征;

对所述N组第一识别声学特征进行特征合并,以获得所述样本说话者的识别声学特征;

对所述第二训练语音数据进行单通道至N通道的通道变换操作,以获得分别在所述N个不同通道下的N组目标语音数据;

分别对所述N组目标语音数据中的每组目标语音数据进行特征提取,以获得N组第二合成声学特征;

对所述N组第二合成声学特征进行特征合并,以获得所述目标说话者的合成声学特征;以及

基于所述样本说话者的识别声学特征,通过预定映射模型映射获得预测合成声学特征,并将所述目标说话者的合成声学特征作为所述预测合成声学特征的真实值对所述预定映射模型进行训练,其中,所述预定映射模型用于在对任一源说话者与所述目标说话者进行语音转换的过程中将所述源说话者的声学特征映射为所述目标说话者的声学特征,以由预定合成器基于所述目标说话者的声学特征进行语音合成以获得所述目标说话者的目标语音。

5.一种语音转换装置,包括:

获取模块,用于获取源说话者分别在N个不同通道下的N组源语音数据,其中,N为大于1的整数;

提取模块,用于分别对所述N组源语音数据中的每组源语音数据进行特征提取,以获得N组源识别声学特征;

合并模块,用于对所述N组源识别声学特征进行特征合并,以获得所述源说话者的声学特征;

映射模块,用于通过预定映射模型将所述源说话者的声学特征映射为目标说话者的声学特征;

合成模块,用于基于所述目标说话者的声学特征进行语音合成,以获得所述目标说话者的目标语音。

6.一种语音转换系统,包括处理器和存储器,其中,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器运行时用于执行如权利要求1至3任一项所述的语音转换方法。

7.一种存储介质,在所述存储介质上存储了程序指令,所述程序指令在运行时用于执行如权利要求1至3任一项所述的语音转换方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于标贝(北京)科技有限公司,未经标贝(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011054910.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top