[发明专利]声音增益值的计算方法、装置和电子设备在审
申请号: | 202011537126.4 | 申请日: | 2020-12-23 |
公开(公告)号: | CN112669878A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 陈孝良;冯大航;郝斌;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 聂鹏 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 增益 计算方法 装置 电子设备 | ||
1.一种声音增益值的计算方法,其特征在于,包括:
获取声音帧;
对所述声音帧进行语音检测得到语音检测结果;
根据所述语音检测结果计算所述声音帧的语音能量参数;其中,所述语音能量参数符合所述声音帧的能量水平;
根据所述语音能量参数和预先配置的固定增益表获取初始增益值;
根据所述声音帧的上一声音帧的增益值和所述初始增益值计算得到所述声音帧的增益值。
2.如权利要求1所述的声音增益值的计算方法,其中所述方法还包括:
根据所述声音帧和所述增益值计算声音帧的输出声音帧。
3.如权利要求1所述的声音增益值的计算方法,其特征在于,所述固定增益表包括:以语音能量参数为变量的函数;其中,语音能量参数越大,对应的函数值越大;语音能量参数越小,对应的函数值越小。
4.如权利要求1所述的声音增益值的计算方法,其特征在于,所述根据所述语音检测结果计算所述声音帧的语音能量参数,包括:
根据所述语音检测结果获取三个语音包络值;其中所述三个语音包络值包括:快包络值、慢包络值以及缓存慢包络值,其中快包络值表示语音的变化;慢包络值在所述检测结果为有语音时缓慢变大,当所述检测结果为无语音时缓慢下降,当所述检测结果为静音时保持不变;缓存慢包络值为历史最大慢包络值;
根据所述三个语音包络值中的最大值计算所述声音帧的语音能量参数。
5.如权利要求4所述的声音增益值的计算方法,其特征在于,所述语音检测结果为所述声音帧中包括语音的概率值,所述根据所述语音检测结果获取三个语音包络值,包括:
当所述概率值大于或等于检测概率阈值时,根据第一平滑系数计算快包络值,根据第二平滑系数计算慢包络值,记录最大慢包络值;其中所述第一平滑系数和第二平滑系数为固定值,且第二平滑系数大于第一平滑系数;
当所述概率值小于检测概率值且大于零时,根据第一平滑系数计算快包络值,根据第三平滑系数计算慢包络值,记录最大慢包络值;其中,第三平滑系数与所述概率值正相关;
当所述概率值等于零时,根据第一平滑系数计算快包络值,慢包络值保持不变,记录最大慢包络值。
6.如权利要求1所述的声音增益值的计算方法,其特征在于,所述根据所述声音帧的上一声音帧的增益值和所述初始增益值计算调整增益值,包括:
根据所述声音帧的上一声音帧的增益值和所述初始增益值计算调整增益值;
根据所述初始增益值和所述调整增益值计算得到所述声音帧的增益值。
7.如权利要求6所述的声音增益值的计算方法,其特征在于,所述根据所述声音帧的上一声音帧的增益值和所述初始增益值计算调整增益值,包括:
计算所述初始增益值与所述上一声音帧的增益值的差值作为调整增益值。
8.如权利要求7所述的声音增益值的计算方法,其特征在于,所述根据所述初始增益值和所述调整增益值计算得到所述声音帧的增益值,包括:
计算所述初始增益值和所述调整增益值的和作为所述声音帧的增益值。
9.如权利要求1-8任一项所述的声音增益值的计算方法,其特征在于,所述声音帧为一个声音帧中的子声音帧,所述上一声音帧为上一声音帧的最后一个子声音帧。
10.如权利要求9所述的声音增益值的计算方法,其特征在于,所述根据所述初始增益值和所述调整增益值计算得到所述声音帧的增益值,包括:
获取所述子声音帧中的采样点个数;
将所述调整增益值平均分为所述采样点个数份得到第一调整增益值;
计算所述初始增益值和所述第一调整增益值的和作为所述子声音帧的增益值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011537126.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能化施肥播种机
- 下一篇:一种处理高盐高有机物废水的窑炉