[发明专利]一种基于自编码器的工业场景异常声音检测与识别方法在审
申请号: | 202111513430.X | 申请日: | 2021-12-10 |
公开(公告)号: | CN114333773A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 罗文俊;邵鑫;陈自刚;陈龙;牟覃宇 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L19/16;G10L25/03;G10L25/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码器 工业 场景 异常 声音 检测 识别 方法 | ||
1.一种基于自编码器的工业场景异常声音检测与识别方法,其特征在于:首先是对工业场景的声音进行预处理,包括预加重、分帧和加窗;然后每帧信号经互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD),得到若干层IMF分量,计算每一层的IMF的短时能量、每一层IMF能量与原始信号的能量比值和每一层IMF的梅尔倒谱系数(Mel Frequency CepstrumCoefficients,MFCC),并取三者的并集构成目标声音信号的特征向量;用提取的特征向量训练自编码器,对正常声音和已知异常声音的特征进行重建,利用梯度下降算法反向传播误差以调整网络参数,通过迭代微调逐步使重构误差函数达到最小值,以学习样本数据中的关键抽象特征,得到正常场景声音模型和特定异常场景声音模型;最后异常声音检测与识别,异常声音的特征经过训练好的异常检测自编码器后,无法很好的重建特征,会产生很大的重构误差,以此重构误差与误差阈值进行比较,再通过阈值条件判定待测声音是否为异常声音;同理异常声音的特征经过异常识别自编码器后,通过阈值条件判定待测声音是否为特定异常;
所诉方法具体包括三个必要过程:声音特征提取、场景声音建模和异常声音检测与识别。
(1)声音特征提取过程为:
(1.1)对工业场景的正常声音和已知异常声音的样本进行预加重、分帧和加窗;
(1.2)将每帧信号经CEEMD将其分解成若干层IMF分量;
(1.3)计算每一层的IMF的短时能量、每一层IMF能量与原始信号的能量比值和每一层IMF的MFCC,并取三者的并集构成目标声音信号的特征向量。
(2)工业场景声音建模过程为:
(2.1)编码:编码器将输入特征向量X,转换为潜在特征Z;
(2.2)解码:解码器将潜在特征Z,重构成输入特征向量X';
(2.3)利用平方误差函数计算网络误差J(X,X′);
(2.4)利用梯度下降算法反向传播误差以调整网络参数,通过迭代微调逐步使重构误差函数达到最小值,以学习样本数据中的关键抽象特征,得到工业场景声音模型。
(3)异常声音检测与识别过程为:
(3.1)对待测声音进行预处理,并提取其特征向量;
(3.2)将特征向量输入到训练好的异常检测自编码器或异常识别自编码器进行特征重构,得到重构误差分数;
(3.3)通过重构误差的阈值条件判定待测声音是否为异常声音或某种已知异常声音。
2.如权利要求1所述基于自编码器的工业场景异常声音检测与识别方法,其特征在于,预处理的过程为:
(2.1)预加重:预加重技术的主要作用就是增强信号的高频成分,以补偿信号的高频分量在传输过程中的衰减。一般情况下常采用一阶FIR高通数字滤波器来对信号进行预加重处理,其传递函数为:
H(z)=1-μz-1
其中μ为预加重系数,0.9<μ<1.0。
(2.2)分帧:语音信号具有短时平稳性,因此可以对异常声音信号进行分段处理,其中分开的每段称为一帧。分帧时一般采用重叠分段的方法,两帧重合的数据部分称为帧移。帧移一般取帧长的1/4~1/2。
(2.3)加窗:语音信号的分帧是采用可移动的有限长度窗口进行加权的方法来实现的,在语音领域,最常见的窗函数是利用余弦函数的汉宁窗(Hanning windows)和汉明窗(Hamming windows)。对于长度为N的离散信号x[n],0≤n≤N-1,这两种窗函数所对应的权重ω[n]可表示为:
其中当α=0.5时,为汉宁窗;当α=0.46时,为汉明窗。对异常声音信号进行预处理时,需要尽可能保留声音信号的波形特征,通过综合考虑,选择汉明窗进行分帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111513430.X/1.html,转载请声明来源钻瓜专利网。