[发明专利]用于语音清晰度增强的宽带语音频谱倾斜度特征参数重建方法有效
申请号: | 201811249506.0 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109215635B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 胡瑞敏;李罡;张锐;王晓晨 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L21/02;G10L25/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 清晰度 增强 宽带 频谱 倾斜度 特征 参数 重建 方法 | ||
本发明提供一种用于语音清晰度增强的宽带语音频谱倾斜度特征参数重建方法,包括基于循环神经网络的频谱倾斜度重建网络的训练阶段和使用阶段,训练阶建立语音数据集,对数据集中的语音资料进行预处理;输入预处理后的窄带语音资料,进行短时傅里叶变换得到窄带语音频谱,将频谱信息对数化获取对数幅度谱;输入预处理后的宽带语音资料,提取宽带语音信号频谱倾斜度的全极点模型参数,转化成线性频谱对参数;训练频谱倾斜度重建网络并使用,重建宽带语音频谱倾斜度的全极点模型参数。本发明根据窄带语音信号重建宽带语音信号频谱倾斜度参数,适用于所有基于频谱倾斜度特征的语音清晰度增强系统之中,且可适配多语种、多模态的语音信号。
技术领域
本发明提供一种用于语音清晰度增强的宽带语音频谱倾斜度特征参数重建方法,涉及语音信号处理和通信技术领域,适用于所有基于频谱倾斜度特征的语音清晰度增强系统之中,且可适配多语种、多模态的语音信号。
背景技术
21世纪以来,移动通信技术迅速发展,手机等移动通信设备快速普及。凭借手机带来的便利,人们得以随时随地使用移动通信设备进行实时语音通信;在这种便利之下,人们不可避免的在车站、餐馆、工厂等多样化嘈杂环境下通话,嘈杂环境中的噪声严重降低了语音通话质量。
语音通信流程可以简要分为两个阶段(如图1所示):第一阶段为说话阶段,说话人向手机说话,手机麦克风采集语音信号,并将信号编码,最后作为上行信号发送至通信信道中;第二阶段为听音阶段,手机从信道中接收到由通信网络发出的下行信号,由手机解码重新生成语音信号,最后由手机播放解码后的语音信号,人耳接收到播放的语音信号,一条语音信息的通信过程完成了。接收下行信号、收听语音内容的过程,站在语音收听者的角度来看,称作近端;发生语音信号、发送上行信号的过程,仍然站在语音收听者的角度来看,称作远端。
远端信号处理过程中,研究者们逐步研究出了语音增强技术用于抑制麦克风采集到的语音信号中的环境噪声。在语音增强过程中,一方面利用软件算法,根据语音信号时频特性、声学特性、语言学特性等一系列特征,滤除语音信号之外的能量,并对滤波后信号成分有所缺失的语音信号进行语音特征重建;另一方面利用硬件辅助,在手机上安装多个的专用麦克风用于环境声采集,将语音信号与噪声麦克风采集到的噪声信号进行谱减法或组成自适应滤波系统。凭借一系列的软硬件结合措施,语音增强技术已经能较为完整的滤除麦克风采集到的语音信号中的噪声成分,并保证语音失真非常小。
近端信号处理过程中,为了抑制听音过程中的环境噪声,研究者们最先想到的是噪声抵消策略:使用麦克风采集环境噪声,然后发出与噪声相位相反,频率、振幅相同的声波与噪声干涉实现相位抵消,降低环境噪声能量。主动降噪耳机就是基于噪声抵消策略的典型产品,耳机通过物理隔绝方式预先过滤了一部分噪声,剩余噪声通过在耳机播放的信号中追加反相信号抵消掉。但在听筒接听模式缺少耳机物理隔绝的情况下,耳朵直接暴露在能量巨大的环境噪声之中,同时伴随着环境混响、听筒难以保证正对耳朵等一系列问题,抗噪效果大幅度下降。
在手机听筒接听模式下噪声抵消策略失效的情况下,为了保障听音者接收的语音信号足够清晰,研究者们又提出了近端听音增强技术,基于感知声学、语言学和信号处理方法,通过改善语音信号感知可懂度的方式,增强语音信号鲁棒性,使语音信号的在相同噪声条件下更容易被听音者理解;由于其以改善语音信号可懂度为目标,因而又被称作语音清晰度增强或语音可懂度增强技术。
语音清晰度增强技术的传统方法主要分为两类:基于规则的方法和基于度量的方法。基于规则的方法不考虑周围的环境噪声,仅根据固定的语音特性调整规则修正语音信号时频特性,该类方法在不同环境下的清晰度提升幅度差异较大,算法鲁棒性较差;基于度量的方法是通过特定的度量指标将语音信号与环境噪声事实对比,动态调整语音信号的增益,对语音清晰度的提升效果较为明显,但是该类方法很大程度上破坏了语音自然度和舒适度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811249506.0/2.html,转载请声明来源钻瓜专利网。