[发明专利]一种音频分类方法及系统及设备及存储介质在审
申请号: | 202111005326.X | 申请日: | 2021-08-30 |
公开(公告)号: | CN113742515A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 陈剑超;肖龙源;李稀敏;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 蔡稷元 |
地址: | 361009 福建省厦门市软件*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 分类 方法 系统 设备 存储 介质 | ||
本发明公开了一种音频分类方法,其通过如下步骤实现对混合类音频的处理分类:预处理,对输入的音频信号进行预加重、分帧和加窗实现对音频信号的预处理;音频帧特征提取,通过对输入的音频信号依次进行基音周期检测、谐波噪声比检测、提取语音和音乐和谐度的一阶差分、和谐度分段以及和谐度分段特征提取等步骤实现音频帧特征的提取;建模,建立一个基于CNN‑LSTM的分类模型并将提取的音频帧特征样本数据输入到模型中进行训练,直到模型的输出误差达到预设要求;分类处理,将待处理的音频信息的音频帧特征输入到建立的模型中进行处理分类并输出分类结果。本发明的优点在于:可以在音频检索处理时节省大量计算,大幅度缩小检索范围,提高了音频分类效率。
技术领域
本发明涉及音频处理领域,尤其涉及一种音频分类方法及系统及设备及存储介质。
背景技术
音频数据具有编码方式、采样率等信息以外,本身是一种无结构的二进制流,具有数据量大、处理复杂、信息关联度高等特点,这使得音频信号的处理工作更加复杂,也给音频检索等应用带来了很大的困难。
音频分类技术是音频结构化的基础,能够解决上述问题,所以称为音频数据处理时最常用的预处理技术。但是,现有技术中的音频分类方法通常是将音频分类为某一个单一类别,而语音与音乐混合类数据是互联网中常见的音频数据,若仅仅标记为混合类,不够精细,已经无法满足一些音频信息处理系统的需求。
现有技术中的音频分类技术主要有基于规则、最小距离和统计学习算法三种。
基于规则的音频分类方法的思路是,选择能将音频类别区分开的特征,设定分类的规则。对音频分类时,根据规则,用计算得到的特征值予设定好的阈值进行比较,对音频进行分类。这种分类方法操作简单,但是只能识别特征单一的音频类型。同时,该方法中若上层决策错误,会累积到下一层,故很依赖于人的先验知识,阈值的设定十分重要,但是如今海量数据的情况下,该方法性能并不稳定。
基于最小距离的音频分类方法是利用了模板匹配的思想,该算法为音频中的每个类别建立一个模板,在对音频进行分类时,计算待分类音频的特征向量,匹配模板向量,并计算它们之间的距离,从而实现音频分类。
基于统计学习的音频分类算法是目前音频分类的重点和热点,它为自动学习分类提供了一种有效途径,也是未来该领域研究的主要方法。但是对于上述分类技术,都是将音频分为几个较大的类别,如语音、音乐、静音、环境噪音等,没有对语音音乐混合音频进行分类。且现在网络上生活中混合音频数据巨大,只有给其打上精细标签,才能更好的进行区分。
综上,现有技术中的算法不能满足音频检索等数据处理中对混合类数据添加精细标签的需求。
发明内容
本发明要解决的技术问题是如何实现混合类音频的处理分类,针对上述要解决的技术问题,现提出一种音频分类方法。
为实现上述目的,本发明提供如下技术方案:一种音频分类方法,其通过如下步骤实现对混合类音频的处理分类:
预处理,对输入的音频信号进行预加重、分帧和加窗实现对音频信号的预处理;
音频帧特征提取,通过对输入的音频信号依次进行基音周期检测、谐波噪声比检测、提取语音和音乐和谐度的一阶差分、和谐度分段以及和谐度分段特征提取等步骤实现音频帧特征的提取;
建模,建立一个基于CNN-LSTM的分类模型并将提取的音频帧特征样本数据输入到模型中进行训练,直到模型的输出误差达到预设要求;
分类处理,将待处理的音频信息的音频帧特征输入到建立的模型中进行处理分类并输出分类结果。
进一步的,所述预加重的具体步骤公式为:其中,θx表示预加重系数,y(n)表示预加重处理后得到信号,x(n)表示音频信号第n个点的幅值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111005326.X/2.html,转载请声明来源钻瓜专利网。