[发明专利]一种人工语音带宽扩展的方法有效

申请号：	201310130081.2	申请日：	2013-04-12
公开（公告）号：	CN103258543A	公开（公告）日：	2013-08-21
发明（设计）人：	陈喆;殷福亮;彭雯雯	申请（专利权）人：	大连理工大学
主分类号：	G10L21/038	分类号：	G10L21/038
代理公司：	大连东方专利代理有限责任公司 21212	代理人：	曲永祚;李洪福
地址：	116024 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种人工语音带宽扩展方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种人工语音带宽扩展的方法，其特征在于：

窄带语音信号经过曲线拟合模块后经过外推高频包络模块，外推高频包络模块的输出信号进入频谱成型模块；窄带语音信号经过特征提取模块后每帧得到一组线性预测系数，构造自回归模型及滤波模块，将白噪声通过此自回归模型进行处理产生与低频相关的高频噪声随机序列，高频噪声随机序列进入频谱成型模块；频谱成型模块输出高频语音；高频语音与窄带语音信号经过语音合成模块得到宽带语音。

2.根据权利要求1所述的一种人工语音带宽扩展的方法，其特征在于：曲线拟合模块采用曲线拟合的方法得到窄带语音低频对数频谱包络曲线方程，通过曲线方程外推出高频对数频谱包络，选取低频部分的共振峰值作为线性拟合的输入；首先输入8kHz采样的窄带语音，估计基音周期，并将时域信号转换到对数频域中，通过估计的基音周期搜索对数频域峰值点，再经过曲线拟合技术描述共振峰的变化曲线，进而外推出高频对数频谱包络曲线，

对窄带语音分帧处理：帧长为128，帧间重叠64个采样点，采用频域方法即计算信号的相关性来计算本帧语音的基音周期T，输入窄带语音为x(n)，自相关函数R(k)为

其中N为帧长，所述N=128，在相关延迟k=20～143范围内搜索R(k)的最大值的位置k'，k'即为基音周期的估值T，将窄带语音做傅里叶变换，然后转换到对数频域，搜索出对数频域中第一个共振峰，第一个共振峰设为p₀。由于基因周期的大小与共振峰的间距大致相等，通过已确定的第一个共振峰p₀和基因周期T，即可搜索出其他的低频共振峰，搜索其他低频共振峰时，只需要在与前一共振峰距离为T的点附近搜索，即可得到其他共振峰的准确位置，设其幅值为lo_env(ω)，即低频对数频谱包络，所对应的频率点ω，lo_env(ω)和ω作为曲线拟合的输入，将低频对数频谱包络lo_env(ω)与低频频点ω建立映射关系

lo_env(ω)＝a·e^bω+c·e^dω，ω＝0～2π*4000，

得到拟合函数中的参数a，b，c，d，既确定映射公式。

3.根据权利要求1所述的一种人工语音带宽扩展的装置和方法，其特征在于：外推高频包络模块是通过已确定的映射公式，将高频频率点代入公式，对未知的高频对数频谱包络数据hi_env(ω)进行外推，外推出高频对数频谱包络hi_env(ω)

hi_env(ω)＝a·e^bω+c·e^dω，ω＝2π*4000～2π*8000。

4.根据权利要求1所述的一种人工语音带宽扩展的方法，其特征在于：特征提取模块是对窄带语音进行线性预测分析，每帧得到一组线性预测系数，构造自回归模型；首先使用窄带语音构造自回归模型，对每一长度为N的语音帧x(n)进行线性预测分析，所述N=128，即计算每一加窗语音帧的自相关函数，并使用Levinson-Durbin算法将其转换成线性预测系数，具体步骤如下：

使用Hamming窗window(n)＝0.5-0.5cos(2πn/N)，n=0,1,…,N-1,N为正整数,对输入语音信号x(n)进行加窗处理，加窗后语音x'(n)为

x'(n)＝x(n)·window(n)，

计算自相关函数，

k=0,1,…,N-1，N为正整数，

采用Levinson-Durbin算法，通过求解以下方程组可获得L阶自回归模型系数a_i,i=1,2,...,L，L为正整数

k=1,2,...,L。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连理工大学，未经大连理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310130081.2/1.html，转载请声明来源钻瓜专利网。