[发明专利]一种基于深度学习的防啸叫扩声方法及系统有效
申请号: | 201910566517.X | 申请日: | 2019-06-27 |
公开(公告)号: | CN110234051B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 蔡野锋;叶超;马登永;沐永生 | 申请(专利权)人: | 中科上声(苏州)电子有限公司 |
主分类号: | H04R3/12 | 分类号: | H04R3/12 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 李萍 |
地址: | 215000 江苏省苏州市相*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 防啸叫扩声 方法 系统 | ||
1.一种基于深度学习的防啸叫扩声方法,其特征在于,包括如下步骤:
A、对采集的语音信号进行预加重;
B、对步骤A预加重后的输入音源信号进行分帧、FFT变换、取频谱幅度值的对数并对连续多帧按顺序进行拼接组合,作为深度学习模型的输入;
C、利用训练完的深度学习模型,对步骤B中的输入进行计算,并输出向量;
D、取所述输出向量的最大值,若其为所述输出向量中的最后一个元素,则不存在啸叫;否,则存在啸叫,执行下一步骤;
E、精确定位啸叫频率;
F、根据精确定位的啸叫频率,利用陷波器进行抑制;
所述步骤C中的深度学习模型由如下步骤训练或所述防啸叫扩声方法还包括如下步骤:
a、提供预采集的声音作为训练音源信号,并进行预加重;
b、对步骤a预加重后的训练音源信号进行分帧、FFT变换并取频谱幅度值的对数;
c、将连续多帧信号组成一组输入向量X,通过人工判断这组信号是否存在啸叫信号并记录啸叫信号位置,若不存在啸叫信号,则标记为其中I为观察频率个数,如果存在啸叫信号,则标记为其中1对应啸叫频率处的位置;
d、当输入向量为非啸叫信号时,则标记输出向量当输入向量为啸叫信号时,则标记输出向量
e、将步骤c的输入向量X和步骤d的输出向量Y作为训练集,使用后向传播算法对深度学习模型进行训练。
2.根据权利要求1所述的防啸叫扩声方法,其特征在于,所述步骤A或步骤a中,预加重滤波器为H(z)=1-αz-1,其中,z为延时单元,α为调节参数。
3.根据权利要求1所述的防啸叫扩声方法,其特征在于,所述步骤B或步骤b中,对分帧后的每帧信号做FFT变换Y(ωi,n),ωi为数字频率,i=0,1,…(I-1),n为帧数,对FFT频谱取绝对值Y1(ωi,n)=|Y(ωi,n)|,并按10为底数并取其对数Y2(ωi,n)=20*log10Y1(ωi,n);
所述步骤c中,将连续N帧信号组成一组输入向量X;所述步骤d中,采用DNN深度学习模型,包含输入层向量大小为(I×N)×1,三层隐藏层大小都为M×1,输出大小为(I+1)×1,输入层为N帧频谱信号Y2(ωi,n)按顺序拼成的(I x N)x1向量X,隐藏层激活函数σ(x)为ReLU,其表达式为σ(x)=max(x,0),其中max(·,·)为取两个数的最大数,输出层激活函数采用softmax,其表达式为:
其中si为输出层的第i个输出,xi为输出层的第i个输入,xj为输出层的第j个输入;
误差函数Err采用交叉熵,其表达式为:其中yi是输出向量Y中的第i个元素,其中ln为以自然数为底数的对数。
4.根据权利要求1所述的防啸叫扩声方法,其特征在于,所述步骤A中,采用麦克风阵列采集声音,并划分频带,将不同的麦克风分配给不同的频带,对同一频带内的各麦克风分别赋予不同的增益,对同一频带内的各麦克风的输出进行叠加形成当前频带输出,并最终对所有频带输出叠加形成总输出;其中,所述麦克风阵列包括多个麦克风,所述多个麦克风沿一弧形间隔排列。
5.根据权利要求4所述的防啸叫扩声方法,其特征在于,所述麦克风阵列对称设置,除位于弧形中间位置的麦克风外,任一麦克风与其靠近弧形中间位置一侧的相邻麦克风之间的弧长d1小于与其远离弧形中间位置一侧的相邻麦克风的之间的弧长d2。
6.根据权利要求5所述的防啸叫扩声方法,其特征在于:弧长d2为弧长d1的两倍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科上声(苏州)电子有限公司,未经中科上声(苏州)电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910566517.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于关注水平控制察觉的环境声音
- 下一篇:2.1声道手持扩声麦克风