[发明专利]单通道语音增强方法及装置、存储介质、终端有效

申请号：	202010482157.8	申请日：	2020-05-29
公开（公告）号：	CN111554315B	公开（公告）日：	2022-07-15
发明（设计）人：	纪伟;于伟维;潘思伟;雍雅琴;董斐;林福辉	申请（专利权）人：	展讯通信（天津）有限公司
主分类号：	G10L21/0232	分类号：	G10L21/0232;G10L25/18
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	朱薇蕾;张振军
地址：	300456 天津市滨海新***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	通道语音增强方法装置存储介质终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种单通道语音增强方法及装置、存储介质、终端，所述方法包括：基于接收到的输入信号获取当前帧信号的频域幅度谱；基于当前帧信号的频域幅度谱对当前帧信号的全带进行VAD处理，以得到当前帧信号的初始全带幅度谱增益函数；将全带划分为多个子带，基于当前帧信号的频域幅度谱以及初始全带幅度谱增益函数对当前帧信号的多个子带分别进行VAD处理，并根据各子带的VAD处理结果更新初始全带幅度谱增益函数，以得到当前帧信号的更新全带幅度谱增益函数；根据当前帧信号的频域幅度谱以及更新全带幅度谱增益函数计算得到语音增强后的频谱。通过本发明方案能够有效抑制非平稳噪声并保护语音质量不受损失，利于提高手机等移动设备的语音通话质量。

技术领域

本发明涉及语音处理技术领域，具体地涉及一种单通道语音增强方法及装置、存储介质、终端。

背景技术

随着手机等移动设备的普及以及移动网络的建设发展，用户对语音通话的质量也有了越来越高的要求。

在进行语音通话时，近端讲话者往往置身于嘈杂的背景环境中，环境中的噪声会污染有用的语音信息。如果含有噪声的上行语音信号不进行处理，将对远端接收者造成很大的困扰，使其无法准确掌握语音的含义。

此外，还有一些情况下，近端讲话者不仅身处噪声环境，在通话时还会开启免提通话模式。例如，司机在车内驾驶过程中开启免提通话、儿童在商场中使用电话手表进行通话等场景。不同于手持模式，免提通话时因为嘴巴与通话设备的麦克风距离较远，麦克风接收到的含噪语音信号的信噪比相比手持模式会更低，这就导致远端接收者更加难以听清楚语音的内容。

针对噪声环境下的免提通话模式，需要使用有效的语音增强算法对近端含噪语音进行噪声抑制，将处理后的清晰语音作为上行信号传送，从而提升语音通话质量。

但是，现有的语音增强技术在非平稳噪声以及免提通话场景中的表现不尽如人意，降噪效果差，严重影响语音通话质量。

发明内容

本发明解决的技术问题是如何更有效地提高语音通话质量。

为解决上述技术问题，本发明实施例提供一种单通道语音增强方法，包括：基于接收到的输入信号获取当前帧信号的频域幅度谱；基于所述当前帧信号的频域幅度谱对所述当前帧信号的全带进行VAD处理，以得到所述当前帧信号的初始全带幅度谱增益函数；将所述全带划分为多个子带，基于所述当前帧信号的频域幅度谱以及所述初始全带幅度谱增益函数对所述当前帧信号的多个子带分别进行VAD处理，并根据各子带的VAD处理结果更新所述初始全带幅度谱增益函数，以得到所述当前帧信号的更新全带幅度谱增益函数；根据所述当前帧信号的频域幅度谱以及所述更新全带幅度谱增益函数计算得到语音增强后的频谱。

可选的，所述基于接收到的输入信号获取当前帧信号的频域幅度谱包括：对所述输入信号进行时域上的分帧操作；对分帧得到的当前帧信号进行时频变换操作，以得到所述当前帧信号的频域幅度谱。

可选的，所述基于所述当前帧信号的频域幅度谱对所述当前帧信号的全带进行VAD处理，以得到所述当前帧信号的初始全带幅度谱增益函数包括：对所述当前帧信号的频域幅度谱进行噪声估计，以得到所述当前帧信号的噪声功率谱；根据所述噪声功率谱计算得到所述当前帧信号的初始全带幅度谱增益函数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于展讯通信（天津）有限公司，未经展讯通信（天津）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010482157.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种电力工程电缆沟用电缆支架
下一篇：一种脐血单个核细胞的分离方法及其应用

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]单通道语音增强方法及装置、存储介质、终端有效

专利文献下载