[发明专利]音频识别方法、设备和存储介质有效
申请号: | 202110220851.7 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112951268B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 赵情恩;曾新贵;熊新雷;陈蓉;肖岩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/27;G10L25/51 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 识别 方法 设备 存储 介质 | ||
1.一种音频识别方法,包括:
获取待处理的音频数据;
对所述音频数据进行特征提取,以得到所述音频数据的倒谱特征信息;
将所述倒谱特征信息输入到第一音频识别模型,以得到所述音频数据的音频类型为第一音频类型的第一概率值;
将所述倒谱特征信息输入到第二音频识别模型,以得到所述音频数据的音频类型为第二音频类型的第二概率值;
根据所述第一概率值和所述第二概率值,确定所述音频数据的音频类型;
其中,所述对所述音频数据进行特征提取,以得到所述音频数据的倒谱特征信息,包括:
对所述音频数据进行频域变换,以得到所述音频数据的频域数据;
通过线性滤波器对所述频域数据中第一频率范围所对应的第一幅度值数据进行线性滤波处理,以得到处理后的第一幅度值数据;
通过逆滤波器对所述频域数据中第二频率范围所对应的第二幅度值数据进行逆滤波处理,以得到处理后的第二幅度值数据,其中,所述第一频率范围的最大频率值与所述第二频率范围的最小频率值相同;
根据处理后的第一幅度值数据和第二幅度值数据,确定所述音频数据对应的倒谱特征信息。
2.根据权利要求1所述的方法,其中,所述第一音频识别模型通过以下方式训练得到:
获取音频类型标签为第一音频类型的音频样本数据;
对所述音频样本数据添加噪声数据,以得到处理后的音频样本数据;
将所述处理后的音频样本数据作为所述第一音频识别模型的输入,并将所述音频类型标签作为所述第一音频识别模型的输出,对所述第一音频识别模型进行训练。
3.根据权利要求1所述的方法,其中,在所述对所述音频数据进行特征提取,以得到所述音频数据的倒谱特征信息之前,所述方法还包括:
对所述音频数据进行回音消除处理。
4.根据权利要求3所述的方法,其中,在所述对所述音频数据进行回音消除处理之前,所述方法还包括:
对所述音频数据进行降噪处理。
5.根据权利要求1-4任一项所述的方法,其中,所述根据所述第一概率值和所述第二概率值,确定所述音频数据的音频类型,包括:
根据所述第一概率值和所述第二概率值,确定对应的似然比值;
将所述似然比值与预设阈值进行比较,以得到比较结果;
根据所述比较结果,确定所述音频数据的音频类型。
6.根据权利要求5所述的方法,其中,所述根据所述比较结果,确定所述音频数据的音频类型,包括:
在所述似然比值大于预设阈值的情况下,确定所述音频数据的音频类型为所述第一音频类型;
在所述似然比值小于或者等于预设阈值的情况下,确定所述音频数据的音频类型为所述第二音频类型。
7.一种音频识别装置,包括:
获取模块,用于获取待处理的音频数据;
特征提取模块,用于对所述音频数据进行特征提取,以得到所述音频数据的倒谱特征信息;
第一识别模块,用于将所述倒谱特征信息输入到第一音频识别模型,以得到所述音频数据的音频类型为第一音频类型的第一概率值;
第二识别模块,用于将所述倒谱特征信息输入到第二音频识别模型,以得到所述音频数据的音频类型为第二音频类型的第二概率值;
确定模块,用于根据所述第一概率值和所述第二概率值,确定所述音频数据的音频类型;
其中,所述特征提取模块,包括:
频域变换单元,用于对所述音频数据进行频域变换,以得到所述音频数据的频域数据;
线性滤波单元,用于通过线性滤波器对所述频域数据中第一频率范围所对应的第一幅度值数据进行线性滤波处理,以得到处理后的第一幅度值数据;
逆滤波单元,用于通过逆滤波器对所述频域数据中第二频率范围所对应的第二幅度值数据进行逆滤波处理,以得到处理后的第二幅度值数据,其中,所述第一频率范围的最大频率值与所述第二频率范围的最小频率值相同;
第一确定单元,用于根据处理后的第一幅度值数据和第二幅度值数据,确定所述音频数据对应的倒谱特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110220851.7/1.html,转载请声明来源钻瓜专利网。