[发明专利]基于音频频谱图的异常声音提取识别方法及装置在审

专利信息
申请号: 202210245234.7 申请日: 2022-03-14
公开(公告)号: CN114694640A 公开(公告)日: 2022-07-01
发明(设计)人: 谢小良;张樊;姚欣平;张媛媛;周晴情;晋友迪;毕胜男;乔玲;贺婷婷;宋子睿;黄楚然 申请(专利权)人: 湖南工商大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/16;G10L25/03;G10L25/51;G06K9/62;G06N20/10
代理公司: 成都弘毅天承知识产权代理有限公司 51230 代理人: 陈仕超
地址: 410205 湖南省长沙市*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 音频 频谱 异常 声音 提取 识别 方法 装置
【说明书】:

发明公开了基于音频频谱图的异常声音提取识别方法,涉及异常声音提取识别技术领域,用于解决现有技术中音频信息提取识别方法在进行匹配提取识别语音时精确度不高,所需训练样本很大的问题,本发明包括对音频数据进行预处理;对训练样本进行时频转换,对训练样本的音频信号进行时频转换,形成频谱动画图;提取频谱动画图的梯度特征;获得新特征矩阵;构建模型,通过机器学习算法构建SVM模型;获得模型,将新特征矩阵作为输入,音频数据的标记作为预期输出,使用SVM模型进行训练,得到异常声音识别模型。本发明中将图像识别技术与音频识别技术结合,所以可以提高对音频信息提取识别的精确度,并减小相应的训练样本。

技术领域

本发明涉及异常声音提取识别技术领域,更具体的是涉及基于音频频谱图的异常声音提取识别方法及装置。

背景技术

随着信息产业与计算机技术的快速发展,图像、视频、音频等多媒体数据的数据量高速增长,并已逐渐成为信息处理领域中主要的信息媒体形式,其中音频信息占有很重要的地位,这时人们面临的不是缺乏多媒体数据,而是如何对浩如烟海的多媒体大数据进行有效的处理、深入分析和充分利用,音频信息的大数据化,一方面为人们的需求提供了条件,但是另一方面也使得人们对于这些音频信息的管理和检索增加了难度。

为了让音频信息更好的为人们所利用,需要相应音频信息的提取识别方法,相应技术中频信息的提取识别方法主要有三类:基于模版匹配的,基于概率统计模型的以及基于判别模型的,动态时间规整(DTW)算法属于模版匹配模型,隐马尔可夫模型(HiddenMarkov Model,HMM)和高斯混合模型(Gaussian Mixture Model,GMM)是基于概率统计的模型,基于判决模型的算法有K均值法、模糊C均值法、支持向量机(Support Vector Machine,SVM)、神经网络等,上述音频信息的提取识别方法可以对音频信息进行提取。

但是,相应技术中的音频信息提取识别方法在进行匹配提取识别语音时精确度不高,而且所需训练样本也很大。

发明内容

本发明的目的在于:为了解决现有技术中音频信息提取识别方法在进行匹配提取识别语音时精确度不高,所需训练样本很大的问题,本发明提供基于音频频谱图的异常声音提取识别方法及装置,以能提高对音频信息提取识别的精确度,并减小训练样本。

本发明为了实现上述目的具体采用以下技术方案:

基于音频频谱图的异常声音提取识别方法,包括如下步骤:

对音频数据进行预处理,对采用的音频数据进行预处理,并对音频数据进行分类和标记,将预处理后的数据分为训练样本和测试样本;

对训练样本进行时频转换,对训练样本的音频信号进行时频转换,形成频谱动画图;

提取频谱动画图的梯度特征,对频谱动画图进行强化降噪处理,再进行图像增强和二值化,然后利用短时傅里叶变换进行时频分析,并计算图像水平方向和垂直方向的梯度,形成频谱动画图的特征矩阵,最后分析频谱动画图并提取图像梯度特征;

获得新特征矩阵,对提取出的图像梯度特征进行降维,得到新特征矩阵;

构建模型,通过机器学习算法构建SVM模型;

获得模型,将新特征矩阵作为输入,音频数据的标记作为预期输出,使用SVM模型进行训练,得到异常声音识别模型。

进一步的,所述并计算图像水平方向和垂直方向的梯度包括:

分别使用f1=(一1,0,1)和f2=(-1,0,1)T作为卷积核,与提取出的骨皮质图像做卷积得到x方向的梯度gx和y方向的梯度gy

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工商大学,未经湖南工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210245234.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top