[发明专利]一种改善喉振话筒语音音质的方法无效

申请号：	201210049868.1	申请日：	2012-02-29
公开（公告）号：	CN102610236A	公开（公告）日：	2012-07-25
发明（设计）人：	栗学丽;冯大伟	申请（专利权）人：	山东大学
主分类号：	G10L21/02	分类号：	G10L21/02
代理公司：	济南金迪知识产权代理有限公司 37219	代理人：	吕利敏
地址：	250100 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种改善喉振话筒语音音质的方法，提出由STRAIGHT语音模型得到完全去除激励影响的精确幅度谱，并加重此幅度谱中对喉振语音听觉感知起重要作用的第一、二共振峰区域，得到适用于语音转换的共振峰加权Mel倒谱参数加增益参数、线谱对参数加增益参数分别作为转换的源、目标特征参量，比起传统常用的倒谱-倒谱参数对、线谱对-线谱对参数对、Mel倒谱-Mel倒谱参数对有更好的映射关系。而且设计的动态前馈神经网络能自动选取网络的拓扑结构，比起固定网络结构的神经网络有着较好的泛化能力及较高的拟合精度，可训练出最优的非线性映射函数，使得改善后的语音音质有较大的提高。
搜索关键词：	一种改善话筒语音音质方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种改善喉振话筒语音音质的方法，其特征在于，该方法包括如下步骤：(1)利用近讲话筒和喉振话筒同时录制训练语音，喉振话筒录制的语音作为源语音，近讲话筒录制的语音作为目标语音；(2)分别建立源语音和目标语音的STRAIGHT语音模型，得到基频参数、非周期指数和幅度谱，作为语音分析‑修改‑合成的模型；(3)由幅度谱分别提取源语音的共振峰加权Mel倒谱参数和增益参数作为源语音的特征参量，及目标语音的线谱对参数和增益参数作为目标语音的特征参量；(4)将步骤(3)中所述的特征参量送入动态前馈神经网络中训练；(5)动态前馈神经网络是根据特征结构自动选取网络的拓扑结构，训练出最优的非线性映射函数；(6)利用喉振话筒录制测试语音，建立测试语音的STRAIGHT语音模型，由幅度谱提取共振峰加权Mel倒谱参数和增益参数，送入步骤(5)训练得到的最优非线性映射函数中，得到修改后的线谱对参数和增益参数；(7)由修改后的线谱对参数和增益参数得到修改后的幅度谱，与基频参数和非周期指数一起利用STRAIGHT模型合成出清晰的语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东大学，未经山东大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210049868.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种改善喉振话筒语音音质的方法无效

专利文献下载