[发明专利]一种基于深度学习的语音转换方法有效

专利信息
申请号: 201710589792.4 申请日: 2017-07-19
公开(公告)号: CN107545903B 公开(公告)日: 2020-11-24
发明(设计)人: 李燕萍;凌云志 申请(专利权)人: 南京邮电大学
主分类号: G10L25/24 分类号: G10L25/24;G10L25/30;G10L17/04;G10L17/18
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 朱小兵
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 语音 转换 方法
【说明书】:

发明公开了一种基于深度学习的语音转换方法,属于语音信号处理技术领域。本发明使用声音编解码器AHOcoder作为特征提取端和语音合成端,使用一种深度学习的方法对语音特征进行训练分别得到源说话人和目标说话人的深层特征,同时得到由深层特征重构原始特征的解码能力,使用BP神经网络实现源说话人和目标说话人深层特征的映射,从而实现语音转换。本发明优点在于对语音的原始特征进行了拼接,认为拼接后的联合特征参数包含有说话人语音特性的动态特征,通过预训练深度自编码器加速了深度神经网络的训练,且通过深层特征的转换使得在使用少量语料进行训练的情况下得到了品质较好的转换后的语音,并且本发明支持离线学习,节约了终端设备的计算资源和内存。

技术领域

本发明涉及一种语音转换与语音合成的方法,属于语音信号处理技术领域。

背景技术

语音转换技术是语音信号处理的一个研究分支,它涵盖了说话人识别、语音识别及语音合成等领域的内容,拟在保留原有的语义信息不变的情况下改变语音的个性化信息,使特定说话人(即源说话人)的语音听起来像另一个特定说话人(即目标说话人)的语音。语音转换的主要任务包括提取两个特定说话人语音的特征参数并进行映射转换,然后将变换后的参数解码重构成转换后的语音。在此过程中要保证得到的转换后语音的听觉质量和转换后个性特征是否精确。

语音转换技术的研究经过多年发展,语音转换领域已经涌现出多种不同的方法,其中以高斯混合模型为代表的统计转换方法已经成为该领域中的经典方法。但是这类算法还是存在某些缺陷,比如:使用高斯模型进行语音转换实验,转换后的语音音质较差,且对高斯模型的混合度等参数设置得不恰当,通常导致欠拟合和过拟合;使用高斯混合模型来训练映射函数时考虑的是全局变量并通过迭代训练数据,这导致了计算量骤增,且需要在训练数据充分时,高斯混合模型才能达到较好的转换效果,这不适用于有限的计算资源和设备。

近年来,深度学习领域的火热加速了深度神经网络的训练速度和网络的有效性,其建模能力强,可以逼近复杂函数,更重要的是深度神经网络可以学习到深层特征表示,因此在使用比传统的高斯混合模型更少的训练数据的情况下,也能保证模型对特征参数转换的性能,且训练深度学习模型时支持离线学习,所以一定程度上可以解决用户终端的计算资源。

发明内容

本发明所要解决的技术问题是:在有限的计算资源和设备的条件下,提供一种语音转换方法,利用深度学习的优点结合深度学习加速网络训练的方法,应用AHOcoder语音编解码器,通过离线学习节约终端计算资源,且通过使用少量的训练数据也能得到较好的转换效果。

本发明为解决上述技术问题采用以下技术方案:

本发明提出一种基于深度学习的语音转换方法,包括训练步骤和语音转换步骤,其中,训练步骤如下:

1)、利用AHOcoder语音编解码器分别对源说话人和目标说话人的语音进行处理,提取出各自的梅尔倒谱特征参数Xt,Yt

2)、将提取出的特征参数逐句进行DTW对齐,然后取每一帧特征参数和其前后各一帧的特征拼接形成联合特征参数,分别作为源说话人的特征参数和目标说话人的特征参数,即Xp=(Xt-1,Xt,Xt+1),Yp=(Yt-1,Yt,Yt+1);

3)、通过深度堆栈自编码器DSAE分别对源说话人和目标说话人的特征参数进行训练,分别得到源说话人的深度堆栈自编码器DSAEs和目标说话人的深度堆栈自编码器DSAEt,然后利用前馈算法,将训练使用源说话人和目标说话人的语音特征参数分别逐帧输入到各自对应的DSAE中,得到每一帧对应的中间隐层的激活值,即为源说话人和目标说话人的深层特征DXp,DYp

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710589792.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top