[发明专利]音频数据处理方法、装置、计算机设备以及存储介质有效
申请号: | 201911155938.X | 申请日: | 2019-11-22 |
公开(公告)号: | CN111028860B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 毛光亮;陈茂华;曾剑锋 | 申请(专利权)人: | 深圳市康冠智能科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市龙岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 数据处理 方法 装置 计算机 设备 以及 存储 介质 | ||
1.一种音频数据处理方法,其特征在于,所述方法包括:
对原始音频数据进行重采样;
将重采样后的音频数据转换为重叠帧,其中,所述重叠帧的重叠长度设置为大于等于1/2原帧长且小于等于3/4原帧长;
使用Hanming窗对所述重叠帧进行加权处理,再对加权处理后的重叠帧中的每一音频数据帧执行快速离散傅里叶变换,得到离散音频数据;
将获得的离散音频数据进行归一化处理,再采用预设轻量级音频分析库提取归一化处理后的离散音频数据中的鲁棒性特征;
采用下述公式对离散音频数据进行归一化处理:
其中absoluteSpectrogram表示绝对值离散音频数据,max Amp表示最大振幅,min Amp表示最小振幅;
将鲁棒性特征与预设模板鲁棒性特征进行特征匹配,其中所述预设模板鲁棒特征包括声强、响度、音高、基音周期或基音频率中的一种或多种;
若所述鲁棒性特征与预设模板鲁棒性特征不匹配,判定所述原始音频数据为异常音频数据;
若所述鲁棒性特征与预设模板鲁棒性特征匹配,判定所述原始音频数据为正常音频数据;
所述对原始音频数据进行重采样,包括:
确定对所述原始音频数据的重采样频率,所述重采样频率为采样帧与每秒帧数值的乘积;
按照所确定的重采样频率对所述原始音频数据进行重采样。
2.如权利要求1所述的方法,其特征在于,所述按照所确定的重采样频率对所述原始音频数据进行重采样包括:确定所述重采样频率,并通过线性插值法对所述原始音频数据进行重采样;
所述将重采样后的音频数据转换为重叠帧,包括:
将重采样后的音频数据分割成相同帧长的多个音频数据帧;
将相邻的两个音频数据帧按照预定的重叠长度进行重叠,获得所述重叠帧。
3.如权利要求1所述的方法,其特征在于,所述使用Hanming窗对所述重叠帧进行加权处理,再对加权处理后的重叠帧中的每一音频数据帧执行快速离散傅里叶变换,得到离散音频数据,包括:
使用预定窗长的Hanming窗乘以重叠帧中的每一音频数据帧,得到加权处理后的重叠帧;
采用快速傅里叶变换算法对经过加权处理后的重叠帧中的每一音频数据帧进行傅里叶变换,得到离散音频数据。
4.如权利要求1所述的方法,其特征在于,所述将获得的离散音频数据进行归一化处理,再采用预设轻量级音频分析库提取归一化处理后的离散音频数据中的鲁棒性特征,包括:
将获得的离散音频数据转换为[0,1]内的归一化的音频数据;
采用预设轻量级音频分析库提取归一化处理后的离散音频数据中的鲁棒性特征;
所述将鲁棒性特征与预设模板鲁棒性特征进行特征匹配,包括:
若所提取的鲁棒性特征只包括一种特征,并且所提取的鲁棒性特征在预设模板鲁棒性特征存在相同的特征,则判定鲁棒性特征与预设模板鲁棒性特征相匹配;若所提取的鲁棒性特征只包括一种特征,并且所提取的鲁棒性特征在预设模板鲁棒性特征不存在相同的特征,则判定鲁棒性特征与预设模板鲁棒性特征不匹配;若所提取的鲁棒性特征包括多种特征,并且所提取的鲁棒性特征在预设模板鲁棒性特征存在相同的特征,则判定鲁棒性特征与预设模板鲁棒性特征相匹配;若所提取的鲁棒性特征包括多种特征,并且所提取的鲁棒性特征在预设模板鲁棒性特征不存在相同的特征,则判定鲁棒性特征与预设模板鲁棒性特征不匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市康冠智能科技有限公司,未经深圳市康冠智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911155938.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钨尾矿综合回收装置
- 下一篇:一种漆液温控设备