[发明专利]语音增强方法及装置有效

申请号：	201310499826.2	申请日：	2013-10-22
公开（公告）号：	CN104575511B	公开（公告）日：	2019-05-10
发明（设计）人：	陈卓;席金苗	申请（专利权）人：	陈卓;席金苗
主分类号：	G10L21/0208	分类号：	G10L21/0208
代理公司：	北京知元同创知识产权代理事务所(普通合伙) 11535	代理人：	聂稻波
地址：	518000 广东省***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音增强方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音增强方法及装置，该方法包括步骤：从多个不同的空间位置采集多路带噪语音信号，根据采集到的带噪语音信号得到初步增强语音信号和噪声参考信号，再将初步增强语音信号和噪声参考信号进行特征值的对比，以对比的比值为依据，对初步增强语音信号进行掩蔽处理，并得到最终的增强语音信号，用于输出。本发明实现了语音信号的360°的全面覆盖，并且信噪比相比于传统的噪声抑制方法（如广义旁瓣对消）提升了5‑10dB，在多噪声环境下，能更加有效的对噪声掩蔽，对目标声源的语音信号进行增强，保证较高的语音质量。

[技术领域]

本发明涉及到语音增强领域，尤其涉及一种语音增强方法及装置。

[背景技术]

用户使用听觉设备需要面对各种各样复杂的环境，目标语音随时在发生变化，如有时是人声，有时候是音乐声，而且目标语音的强度，方位等，都随时在变化。同时，不可避免受到噪声的干扰。

不同场景中噪音种类千差万别。可能是稳态噪声，也可能是动态噪声，可能是冲击噪声，也可能是风噪声。噪声可能是单频音，也可能是窄带噪声，甚至是宽带噪声。

而且，不同的用户在不同的场景中对于目标语音的要求也是有差异的，举例说，在相对安静的环境中，用户需要更加清晰的语音。而在相对嘈杂的环境中，则需要提高语音的可懂度。

[发明内容]

本发明提供了一种语音增强方法，以及和该方法对应的语音增强装置；用于在多噪声环境下，能更加有效的对噪声掩蔽，对目标声源的语音信号进行增强，从而得到去噪的语音，保证较高的语音质量。

本发明的技术方案是：

语音增强方法，包括：

步骤一、从多个不同的空间位置采集多路带噪语音信号；

步骤二、对所述带噪语音信号进行初步语音增强，以获得初步增强语音信号,然后对所述初步增强语音信号进行分频和加窗逐帧处理，将其分割为N个语音T-F单元，并提取每个语音T-F单元中的特征值；

同时，对所述带噪语音信号进行分频和加窗逐帧处理，以得到N个噪声T-F单元，提取每个噪声T-F单元的特征值并将其和设定值进行对比，根据比值确定各个噪声T-F单元对应的掩蔽值，然后进行相应的掩蔽处理，以获得噪声参考信号；

所述语音T-F单元和噪声T-F单元具有一一对应关系；

步骤三、将每个语音T-F单元的特征值和其对应的经掩蔽后的噪声T-F单元的特征值进行比较，并以比值为依据得到每个语音T-F语音单元相对应的掩蔽值，然后根据得到的掩蔽值进行相应的掩蔽处理；

步骤四、对经过掩蔽处理后的N个语音T-F单元进行合成，以获得最终的增强语音信号。

以及和上述方法对应的语音增强装置，包括：

语音采集模块：用于从多个不同的空间位置采集多路带噪语音信号；

语音增强模块：用于对所述语音采集模块采集到的带噪语音信号进行初步语音增强，获得初步增强语音信号；

第一人耳滤波模块：用于对所述语音增强模块中输出的初步增强语音信号进行分频和加窗逐帧处理，形成N个语音T-F单元；

第一特征提取模块：用于提取每个语音T-F单元的特质值；

噪声参考模块：包括第二人耳滤波模块、第二特征提取模块、第二特征比较模块及第二掩蔽模块；所述第二人耳滤波模块用于对带噪语音信号进行分频和加窗逐帧处理，以形成N个噪声T-F单元，所述第二特征提取模块用于提取每个噪声T-F单元的特征值，所述第二特征比较模块用于将每个噪声T-F单元的特征值和设定值进行对比，并根据比值确定每个噪声T-F单元对应的掩蔽值，所述第二掩蔽模块用于对各噪声T-F单元进行掩蔽处理，以获得噪声参考信号；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于陈卓;席金苗，未经陈卓;席金苗许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310499826.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音增强方法及装置有效

专利文献下载