[发明专利]基于音频频谱图的异常声音提取识别方法及装置在审
申请号: | 202210245234.7 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114694640A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 谢小良;张樊;姚欣平;张媛媛;周晴情;晋友迪;毕胜男;乔玲;贺婷婷;宋子睿;黄楚然 | 申请(专利权)人: | 湖南工商大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16;G10L25/03;G10L25/51;G06K9/62;G06N20/10 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 陈仕超 |
地址: | 410205 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 音频 频谱 异常 声音 提取 识别 方法 装置 | ||
1.基于音频频谱图的异常声音提取识别方法,其特征在于,包括如下步骤:
对音频数据进行预处理,对采用的音频数据进行预处理,并对音频数据进行分类和标记,将预处理后的数据分为训练样本和测试样本;
对训练样本进行时频转换,对训练样本的音频信号进行时频转换,形成频谱动画图;
提取频谱动画图的梯度特征,对频谱动画图进行降噪处理,再进行图像增强和二值化,然后利用短时傅里叶变换进行时频分析,并计算图像水平方向和垂直方向的梯度,形成频谱动画图的特征矩阵,最后分析频谱动画图并提取图像梯度特征;
获得新特征矩阵,对提取出的图像梯度特征进行降维,得到新特征矩阵;
构建模型,通过机器学习算法构建SVM模型;
获得模型,将新特征矩阵作为输入,音频数据的标记作为预期输出,使用SVM模型进行训练,得到异常声音识别模型。
2.根据权利要求1所述的基于音频频谱图的异常声音提取识别方法,其特征在于,所述并计算图像水平方向和垂直方向的梯度包括:
分别使用f1=(一1,0,1)和f2=(-1,0,1)T作为卷积核,与提取出的骨皮质图像做卷积得到x方向的梯度gx和y方向的梯度gy;
设像素点(x,y)的像素值为H(x,y),则水平方向的梯度Gx(x,y)和垂直方向梯度Gy(x,y)分别表示为:
Gx(x,y)=(H(x-1,y),H(x,y),H(x+1,y))·(-1,01)=H(x+1y)-H(x-1,y)
Gy(x,y)=(H(x,y-1),H(x,y),H(x,y+1))T·(-1,0,1)T=H(x,y+1)-H(x,y-1)
其中,T表示转置。
3.根据权利要求2所述的基于音频频谱图的异常声音提取识别方法,其特征在于,所述形成频谱动画图的特征矩阵包括:
每个像素点的图像梯度的辐值G(x,y)和方向θ(x,y)可以由下式得到:
将图像分成若干像素块,并把每个像素块中各像素的辐值与角度对应到九个数的数组中,得到新的矩阵就是该图像的特征矩阵。
4.根据权利要求1所述的基于音频频谱图的异常声音提取识别方法,其特征在于,所述通过机器学习算法构建SVM模型包括:
划分超平面,在给定的样本空间中,通过如下的线性方程划分超平面,
ωT·x+b=0
其中,ω=(ω1,ω2,...,ωd)为特征向量,b为位移项;
求解最大几何间隔,通过如下公式求解最大几何间隔:
s.t.,yi(ωT·xi+b)≥1,i=1,...,n
其中,n为训练样本数;
建立拉格朗日公式,通过如下公式建立拉格朗日公式:
其中,α代表αi的集合,αi表示第i个拉格朗日乘子,xi表示超平面上点的横坐标,yi表示超平面上点的纵坐标,s.t.为约束条件;
优化目标变为:
求对偶问题为:
对ω、b求极小值,即对ω、b求偏导,则得到:
把ω、b回代入L(ω,b,α)得到SVM模型为:
5.根据权利要求4所述的基于音频频谱图的异常声音提取识别装置,其特征在于,包括:
对音频数据进行预处理模块,用于对采用的音频数据进行预处理,并对音频数据进行分类和标记,将预处理后的数据分为训练样本和测试样本;
对训练样本进行时频转换模块,用于对训练样本的音频信号进行时频转换,形成频谱动画图;
提取频谱动画图的梯度特征模块,用于对频谱动画图进行降噪处理,再进行图像增强和二值化,然后利用短时傅里叶变换进行时频分析,并计算图像水平方向和垂直方向的梯度,形成频谱动画图的特征矩阵,最后分析频谱动画图并提取图像梯度特征;
获得新特征矩阵模块,用于对提取出的图像梯度特征进行降维,得到新特征矩阵;
构建模型模块,用于通过机器学习算法构建SVM模型;
获得模型模块,用于将新特征矩阵作为输入,音频数据的标记作为预期输出,使用SVM模型进行训练,得到异常声音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工商大学,未经湖南工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210245234.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种CdIn靶材及其制备方法
- 下一篇:一种园林工程用绿色节能灌溉系统