[发明专利]一种人工语音带宽扩展的方法有效

申请号：	201310130081.2	申请日：	2013-04-12
公开（公告）号：	CN103258543A	公开（公告）日：	2013-08-21
发明（设计）人：	陈喆;殷福亮;彭雯雯	申请（专利权）人：	大连理工大学
主分类号：	G10L21/038	分类号：	G10L21/038
代理公司：	大连东方专利代理有限责任公司 21212	代理人：	曲永祚;李洪福
地址：	116024 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种人工语音带宽扩展方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种人工语音带宽扩展的方法，属于数字信号处理技术领域。

背景技术

目前，公用电话网(PSTN)有效频率范围仅是0.3～3.4KHz，GSM数字蜂窝电话有效带宽不超过4KHz。尽管语言信号的主要能量集中在0.3～3.4KHz频率范围，但实际占用的频率范围要大的多。4KHz窄带语音由于缺失了高频分量，其自然度，可懂度等方面明显变差，听起来“闷闷”的。

发明内容

为了克服上述的不足，本发明的目的在于提供一种人工语音带宽扩展的方法。

一种人工语音带宽扩展的方法，其工作过程如下：

窄带语音信号经过曲线拟合模块后经过外推高频包络模块，外推高频包络模块的输出信号进入频谱成型模块；窄带语音信号经过特征提取模块后每帧得到一组线性预测系数，利用线性预测系数后构造自回归模型及滤波模块，将白噪声通过此自回归模型进行处理产生与低频相关的高频噪声随机序列，高频噪声随机序列进入频谱成型模块；频谱成型模块输出高频语音；高频语音与窄带语音信号经过语音合成模块得到宽带语音。

本发明原理及有益效果：保持算法复杂度较低的优点，产生与真实激励相关性较高的人工激励。本发明首先对已知的低频对数域频谱进行曲线拟合，得到曲线方程，进而外推出高频对数域频谱包络曲线。从窄带语音中低频参数，利用线性预测系数构成自回归模型，使用均匀白噪声序列通过此自回归模型，得到高频噪声序列。此高频噪声序列是与窄带语音具有一定相关性的白噪声，将其转换为对数域频谱，再经过高频对数频谱包络的调制，即可恢复出高频语音，并在复倒谱域合成宽带语音。本发明是一种全盲语音带宽扩展技术，可直接应用于窄带语音接收端。本发明不需要任何先验知识或高频信息，算法复杂度较低，可以恢复出与低频相关性较高的高频部分，且合成的宽带语音听觉效果良好。

附图说明

图1是本发明的流程图。

图2是本发明的宽带语音合成过程。

图3(a)原始宽带语音语谱图。

图3(b)窄带语音语谱图。

图3(c)带宽扩展后的语音语谱图。

图4(a)本发明算法输出和自适应变速率语音编解码器在编码速率为12.2kbps时的输出对比结果分布图。

图4(b)本发明算法输出和宽带自适应变速率语音编解码器在编码速率为8.85kbps时的输出对比结果分布图。

图5窄带语音和本发明合成的宽带语音的谱失真测度图。

图6显示主观测试标准。

具体实施方式

下面结合附图对本发明做进一步说明。

图1是本发明的流程图。如图1所示：

窄带语音信号经过曲线拟合模块后经过外推高频包络模块，外推高频包络模块的输出信号进入频谱成型模块；窄带语音信号经过特征提取模块后每帧得到一组线性预测系数，构造自回归模型及滤波模块，将白噪声通过此AR模型进行处理产生与低频相关的高频噪声随机序列，高频噪声随机序列进入频谱成型模块；频谱成型模块输出高频语音；高频语音与窄带语音信号经过语音合成模块得到宽带语音。

曲线拟合模块

本模块采用曲线拟合的方法得到窄带语音低频对数频谱包络曲线方程，通过曲线方程外推出高频对数频谱包络。选取低频部分的共振峰值作为曲线拟合的输入。首先输入8kHz采样的窄带语音，估计基音周期，并将时域信号转换到对数频域中，通过估计的基音周期搜索对数频域峰值点，再经过曲线拟合技术描述共振峰的变化曲线，进而外推出高频对数频谱包络曲线。

首先，对窄带语音分帧处理，帧长为128，帧间重叠64个采样点。采用频域方法即计算信号的相关性来计算本帧语音的基音周期T。设输入窄带语音为x(n)，自相关函数R(k)为

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连理工大学，未经大连理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310130081.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种人工语音带宽扩展的方法有效

专利文献下载