[发明专利]基于音频频谱图的异常声音提取识别方法及装置在审

专利信息
申请号: 202210245234.7 申请日: 2022-03-14
公开(公告)号: CN114694640A 公开(公告)日: 2022-07-01
发明(设计)人: 谢小良;张樊;姚欣平;张媛媛;周晴情;晋友迪;毕胜男;乔玲;贺婷婷;宋子睿;黄楚然 申请(专利权)人: 湖南工商大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/16;G10L25/03;G10L25/51;G06K9/62;G06N20/10
代理公司: 成都弘毅天承知识产权代理有限公司 51230 代理人: 陈仕超
地址: 410205 湖南省长沙市*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 音频 频谱 异常 声音 提取 识别 方法 装置
【权利要求书】:

1.基于音频频谱图的异常声音提取识别方法,其特征在于,包括如下步骤:

对音频数据进行预处理,对采用的音频数据进行预处理,并对音频数据进行分类和标记,将预处理后的数据分为训练样本和测试样本;

对训练样本进行时频转换,对训练样本的音频信号进行时频转换,形成频谱动画图;

提取频谱动画图的梯度特征,对频谱动画图进行降噪处理,再进行图像增强和二值化,然后利用短时傅里叶变换进行时频分析,并计算图像水平方向和垂直方向的梯度,形成频谱动画图的特征矩阵,最后分析频谱动画图并提取图像梯度特征;

获得新特征矩阵,对提取出的图像梯度特征进行降维,得到新特征矩阵;

构建模型,通过机器学习算法构建SVM模型;

获得模型,将新特征矩阵作为输入,音频数据的标记作为预期输出,使用SVM模型进行训练,得到异常声音识别模型。

2.根据权利要求1所述的基于音频频谱图的异常声音提取识别方法,其特征在于,所述并计算图像水平方向和垂直方向的梯度包括:

分别使用f1=(一1,0,1)和f2=(-1,0,1)T作为卷积核,与提取出的骨皮质图像做卷积得到x方向的梯度gx和y方向的梯度gy

设像素点(x,y)的像素值为H(x,y),则水平方向的梯度Gx(x,y)和垂直方向梯度Gy(x,y)分别表示为:

Gx(x,y)=(H(x-1,y),H(x,y),H(x+1,y))·(-1,01)=H(x+1y)-H(x-1,y)

Gy(x,y)=(H(x,y-1),H(x,y),H(x,y+1))T·(-1,0,1)T=H(x,y+1)-H(x,y-1)

其中,T表示转置。

3.根据权利要求2所述的基于音频频谱图的异常声音提取识别方法,其特征在于,所述形成频谱动画图的特征矩阵包括:

每个像素点的图像梯度的辐值G(x,y)和方向θ(x,y)可以由下式得到:

将图像分成若干像素块,并把每个像素块中各像素的辐值与角度对应到九个数的数组中,得到新的矩阵就是该图像的特征矩阵。

4.根据权利要求1所述的基于音频频谱图的异常声音提取识别方法,其特征在于,所述通过机器学习算法构建SVM模型包括:

划分超平面,在给定的样本空间中,通过如下的线性方程划分超平面,

ωT·x+b=0

其中,ω=(ω1,ω2,...,ωd)为特征向量,b为位移项;

求解最大几何间隔,通过如下公式求解最大几何间隔:

s.t.,yiT·xi+b)≥1,i=1,...,n

其中,n为训练样本数;

建立拉格朗日公式,通过如下公式建立拉格朗日公式:

其中,α代表αi的集合,αi表示第i个拉格朗日乘子,xi表示超平面上点的横坐标,yi表示超平面上点的纵坐标,s.t.为约束条件;

优化目标变为:

求对偶问题为:

对ω、b求极小值,即对ω、b求偏导,则得到:

把ω、b回代入L(ω,b,α)得到SVM模型为:

5.根据权利要求4所述的基于音频频谱图的异常声音提取识别装置,其特征在于,包括:

对音频数据进行预处理模块,用于对采用的音频数据进行预处理,并对音频数据进行分类和标记,将预处理后的数据分为训练样本和测试样本;

对训练样本进行时频转换模块,用于对训练样本的音频信号进行时频转换,形成频谱动画图;

提取频谱动画图的梯度特征模块,用于对频谱动画图进行降噪处理,再进行图像增强和二值化,然后利用短时傅里叶变换进行时频分析,并计算图像水平方向和垂直方向的梯度,形成频谱动画图的特征矩阵,最后分析频谱动画图并提取图像梯度特征;

获得新特征矩阵模块,用于对提取出的图像梯度特征进行降维,得到新特征矩阵;

构建模型模块,用于通过机器学习算法构建SVM模型;

获得模型模块,用于将新特征矩阵作为输入,音频数据的标记作为预期输出,使用SVM模型进行训练,得到异常声音识别模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工商大学,未经湖南工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210245234.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top