[发明专利]基于线谱频率及其阶间差分参数的频谱建模与语音增强方法有效

申请号：	200610038589.X	申请日：	2006-02-28
公开（公告）号：	CN1815552A	公开（公告）日：	2006-08-09
发明（设计）人：	凌震华;王玉华;王仁华	申请（专利权）人：	安徽中科大讯飞信息科技有限公司
主分类号：	G10L13/08	分类号：	G10L13/08;G10L13/02;G10L13/00;G10L21/02
代理公司：	合肥华信专利商标事务所	代理人：	余成俊
地址：	230088***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了基于线谱频率及其阶间差分参数的频谱建模与语音增强方法，包括在频谱参数提取时将线谱频率阶间差分作为提取结果的一部分；在模型建模和训练时分别对线谱频率及其阶间差分参数进行独立建模和训练；在预测时分别预测线谱频率及其阶间差分参数，并利用阶间差分对线谱频率参数进行调整；最终利用调整后的线谱频率参数合成输出语音以达到通过增强和锐化合成语音的共振峰而提高合成语音音质的目的。
搜索关键词：	基于线谱频率及其阶间差分参数频谱建模语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1、基于线谱频率及其阶间差分参数的频谱建模与语音增强方法，包括以下步骤：(1)、对语音信号分帧求取线性预测系数；(2)、线谱频率及其阶间差分参数的获得：将线性预测系数转换成对应阶数的线谱频率参数，同时，对相邻阶的线谱频率计算其差分参数；(3)、对于各阶线谱频率及其阶间差分参数分别独立进行声学模型的训练，采用的模型为隐马尔可夫模型，在模型训练过程中，通过结合语音单元的上下文属性利用决策树对各参数对应的模型进行较为细致的分类，保证得到的声学模型均可以实现依据上下文属性输入的参数预测；(4)、合成阶段的语音增强处理：a、对用户输入的文本进行分析，利用分析得到的各语音单元对应的上下文属性输入训练得到的声学模型，预测合成时使用的各帧线谱频率及阶间差分参数，由于线谱频率和阶间差分参数是分别通过二个独立的声学模型预测的，所以预测得到的阶间差分参数与预测得到的线谱频率的实际阶间差分参数相比并不一致；b、利用各帧预测得到的阶间差分参数依据下式对预测得到的线谱频率进行调整：

l_{i}^{'} = l_{i - 1} + c_{i - 1} + \frac{c_{i - 1}^{2}}{c_{i - 1}^{2} + c_{i}^{2}} [(l_{i + 1} - l_{i - 1}) - (c_{i} + c_{i - 1})]

其中，li，i＝1，2，...，N为预测得到的当前帧第i阶的线谱频率，N为线谱频率参数的阶数；ci，i＝1，2，...，M为预测得到的当前帧第i+1阶和第i阶线谱频率之间的阶间差分参数，M为阶间差分参数的阶数，M＜N；li′，i＝1，2，...，N为调整后当前帧的N阶线谱频率。对于各阶线谱频率，可以选择从低阶(第2阶)到高阶(第M阶)的调整顺序，也可以选择从高阶(第M阶)到低阶(第2阶)的调整顺序，同时可以通过调整遍数来控制这种频谱峰值增强作用的强弱；c、将调整后的线谱频率转换为线性预测系数，同时结合韵律预测模块生成的基音频率参数，送入线性预测滤波器，合成语音并输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽中科大讯飞信息科技有限公司，未经安徽中科大讯飞信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200610038589.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于线谱频率及其阶间差分参数的频谱建模与语音增强方法有效

专利文献下载