[发明专利]声音增益值的计算方法、装置和电子设备在审

申请号：	202011537126.4	申请日：	2020-12-23
公开（公告）号：	CN112669878A	公开（公告）日：	2021-04-16
发明（设计）人：	陈孝良;冯大航;郝斌;常乐	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L25/51	分类号：	G10L25/51
代理公司：	北京竹辰知识产权代理事务所(普通合伙) 11706	代理人：	聂鹏
地址：	100094 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音增益计算方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例公开了一种声音增益值的计算方法、装置、电子设备和计算机可读存储介质。其中该声音增益值的计算方法包括：获取声音帧；对所述声音帧进行语音检测得到语音检测结果；根据所述语音检测结果计算所述声音帧的语音能量参数；其中，所述语音能量参数符合所述声音帧的能量水平；根据所述语音能量参数和预先配置的固定增益表获取初始增益值；根据所述声音帧的上一声音帧的增益值和所述初始增益值计算得到所述声音帧的增益值。上述方法通过计算出符合声音帧能量水平的语音能量参数，解决了现有技术中由于语音检测不准确导致的静音段增益值过大的技术问题。

技术领域

本公开涉及语音处理领域，尤其涉及一种声音增益值的计算方法、装置、电子设备及计算机可读存储介质。

背景技术

目前，不管是语音通话，视频通话，还是语音识别等应用场景，音频自动增益控制(AGC)都是至关重要的一环。在语音、视频通话中，AGC能够提升听感，尤其是远场拾音时，能够增强语音的响度；在语音交互中，AGC能够提升唤醒和识别率。

最简单的硬性增益处理是对所有音频采样乘上一个增益因子，它也等同于在频域每个频率都同时乘上这个增益因子，但由于人的听觉对所有频率的感知不是线性的，是遵循等响度曲线的，导致这样处理后，音频听起来感觉有的频率加强了，有的频率削弱了，导致语言失真的放大。

现有技术中，还根据语音检测(VAD)结果来计算当前语音的强度，从而选择合适的增益因子，但是由于有些VAD的计算量较少，导致VAD准确性下降，而为了保证语音段增益，往往允许静音段的增益值过大，这就导致噪声段幅值变大，听感下降，唤醒和识别率也受其影响。

发明内容

提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

为了解决上述技术问题，第一方面，本公开实施例提供一种声音增益值的计算方法，包括：

获取声音帧；

对所述声音帧进行语音检测得到语音检测结果；

根据所述语音检测结果计算所述声音帧的语音能量参数；其中，所述语音能量参数符合所述声音帧的能量水平；

根据所述语音能量参数和预先配置的固定增益表获取初始增益值；

根据所述声音帧的上一声音帧的增益值和所述初始增益值计算得到所述声音帧的增益值。

进一步的，所述方法还包括：

根据所述声音帧和所述增益值计算声音帧的输出声音帧。

进一步的，所述固定增益表包括：以语音能量参数为变量的函数；其中，语音能量参数越大，对应的函数值越大；语音能量参数越小，对应的函数值越小。

进一步的，所述根据所述语音检测结果计算所述声音帧的语音能量参数，包括：

根据所述语音检测结果获取三个语音包络值；其中所述三个语音包络值包括：快包络值、慢包络值以及缓存慢包络值，其中快包络值表示语音的变化；慢包络值在所述检测结果为有语音时缓慢变大，当所述检测结果为无语音时缓慢下降，当所述检测结果为静音时保持不变；缓存慢包络值为历史最大慢包络值。

根据所述三个语音包络值中的最大值计算所述声音帧的语音能量参数。

进一步的，所述语音检测结果为所述声音帧中包括语音的概率值，所述根据所述语音检测结果获取三个语音包络值，包括：

当所述概率值大于或等于检测概率阈值时，根据第一平滑系数计算快包络值，根据第二平滑系数计算慢包络值，记录最大慢包络值；其中所述第一平滑系数和第二平滑系数为固定值，且第二平滑系数大于第一平滑系数；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司，未经北京声智科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011537126.4/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音增益值的计算方法、装置和电子设备在审

专利文献下载