[发明专利]一种基于mel能量谱和卷积神经网络的声音故障识别方法有效
申请号: | 201811642820.5 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109599126B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 陈曦;蓝志坚;陈卓;李学辉;喻春霞;容伯杰 | 申请(专利权)人: | 广州丰石科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L25/21;G10L25/18;G10L25/15 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510650 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mel 能量 卷积 神经网络 声音 故障 识别 方法 | ||
本发明公开了一种基于mel能量谱和卷积神经网络的声音故障识别方法,首先将初始输入的音频数据进行预加重,之后需要对数据进行分帧、加窗处理,然后要对分帧、加窗后的音频信号进行快速傅里叶变换,提取频域上的能量特征之后,将能量谱通过一组Mel尺度的三角形滤波器组,之后对每一帧对应不同频域的能量作为Y轴,时域上不同帧作为X轴,将数据转换为梅尔能量谱图。此后,需要进一步对能量谱图进行分帧,以适应CNN(卷积神经网络)的输入,每一帧为一个样本,每个样本对应的标签的独热编码作为CNN网络的输出,对CNN网络模型进行训练,直到网络训练误差达到最低。在预测时,输出每一类标签的概率值,取概率值最大的标签作为最终的判别结果。
技术领域
本发明AI声音故障检测识别领域,更具体地,涉及一种基于mel能量谱和卷积神经网络的声音故障识别方法。
背景技术
大型空调冷却设备在现实应用中已经相当普及,对于其发生故障的检测,大多采用了人工检测的方式。专业的工作人员进行巡视检查的方法,可以凭借工作人员的感官和感觉,检查设备的外观、震动、运行声音等,以此来判定设备是否发生破损、松动等异常。这种方式简单方便,但是得到的信息十分有限,且工作人员的知识技能、经验以及观察能力差异化较大,巡视的结果也难以让人满意。
发明内容
本发明的目的是解决现有技术中工作人员判别差异大、信息传达速度慢以及检测成本高的缺陷,提出一种基于mel能量谱和卷积神经网络的声音故障识别方法。
为实现以上发明目的,采用的技术方案是:
一种基于mel能量谱和卷积神经网络的声音故障识别方法,其特征在于,包括以下步骤:
S1:对语音信号进行预加重,增加声音的高频分辨率;
S2:对语音信号进行分帧处理,通过将N个语音信号上的采样点组合为一个观测单位即为为帧,两相邻帧之间有一段重叠区域,此重叠区域包含了M个取样点,M的值为N的1/2或1/3;
S3:对语音信号进行加窗处理,通过采用汉明窗进行加窗使原本没有周期性的语音信号呈现出周期函数的特征,其中窗函数为:
n=0,1…,N-1,N为帧的大小;
S4:乘上汉明窗后的各帧信号进行快速傅里叶变换,得到各帧的频谱,并对语音信号的频谱取模平方得到语音信号的功率谱,设语音信号的DFT为:
式中x(n)为输入的语音信号,N表示傅里叶变换的点数;
S5:将能量谱通过一组Mel尺度的三角形滤波器组,定义一个有M个滤波器的滤波器组,采用的滤波器为三角滤波器,中心频率为f(m),m=1,2,...,M; M取22-26,各f(m)之间的间隔随着m值的减小而缩小,随着m值的增大而增宽;
三角滤波器的频率响应定义为:
式中:
f(m)为中心频率,k为频率;
S6:计算每个滤波器组输出的对数能量:
m=0,1…,M,M为滤波器个数,Hm(k)为滤波器的频率响应;
S7:转换为梅尔能量谱图;步骤S2的分帧是在采样点上进行的,对N个采样点作为一帧进行之后步骤的一系列操作后,最终每一帧提取M个频段的梅尔能量谱作为Y轴的M个值,而X轴以帧数作为单位,由此得到一张梅尔能量谱图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州丰石科技有限公司,未经广州丰石科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811642820.5/2.html,转载请声明来源钻瓜专利网。