[发明专利]一种环境声音分类分析方法、装置和介质在审
申请号: | 202210403964.5 | 申请日: | 2022-04-18 |
公开(公告)号: | CN114882909A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 刘立峰;宋卫华;冯志峰;母健康;王文重;张建军 | 申请(专利权)人: | 珠海高凌信息科技股份有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L21/0332;G10L21/0208 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 张志辉 |
地址: | 519060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 声音 分类 分析 方法 装置 介质 | ||
1.一种环境声音分类分析方法,其特征在于,所述方法包括:
对语音训练数据进行数据增强;
进行数据预处理并对环境声音进行特征提取,得到特征向量;
采用深度CNN网络对所述特征向量进行模型训练,获得所述环境声音的多分类模型并输出。
2.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述对语音训练数据进行数据增强,至少包括:
移动正音高:对所述环境声音的数据集中每个音频信号的音高都增加一个正因子;
移动负音高:对所述环境声音的数据集中每个音频信号的音高都增加一个负因子;
静音修剪:修剪音频剪辑的静音部分,只保留包含声音的部分;
快速拉伸时间:将数据集的每个声音剪辑的时间拉伸到原来的2倍;
缓慢拉伸时间:将数据集的每个声音剪辑的时间拉伸到原来的0.7倍;
添加白噪声:在所述环境声音的数据集中添加白噪声。
3.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述数据预处理包括增加端点检测和去静音功能。
4.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,所述对环境声音进行特征提取,包括:
采用Log-MEL特征提取方法对环境声音进行特征提取。
5.根据权利要求4所述的一种环境声音分类分析方法,其特征在于,采用Log-MEL特征提取方法对环境声音进行特征提取后,所述方法还包括:
得到梅尔频谱图和梅尔倒谱系数;
将所述梅尔频谱图和梅尔倒谱系数进行特征融合。
6.根据权利要求5所述的一种环境声音分类分析方法,其特征在于,得到梅尔频谱图和梅尔倒谱系数后,所述方法还包括:
将所述梅尔频谱图和梅尔倒谱系数输入深度CNN网络进行模型训练。
7.根据权利要求1所述的一种环境声音分类分析方法,其特征在于,在所述对语音训练数据进行数据增强前,所述方法还包括:
获取环境声音;
对所述环境声音进行滤波处理,过滤环境噪音。
8.一种环境声音分类分析装置,其特征在于,所述装置包括:
数据增强模块,用于对语音训练数据进行数据增强;
特征提取模块,用于进行数据预处理并对环境声音进行特征提取,得到特征向量;
训练分类模块,用于采用深度CNN网络对所述特征向量进行模型训练,获得所述环境声音的多分类模型并输出。
9.一种环境声音分类分析装置,其特征在于,所述装置包括:
至少一个处理器;
至少一个存储器,所述存储器用于存储至少一个程序;
当至少一个所述程序被至少一个所述处理器执行时实现如权利要求1-7中任一项所述的一种环境声音分类分析方法。
10.介质,其特征在于,所述介质存储有处理器可执行的程序,所述处理器可执行的程序被处理器执行时实现如权利要求1-7中任一项所述的一种环境声音分类分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海高凌信息科技股份有限公司,未经珠海高凌信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210403964.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:穿刺分离钳
- 下一篇:一种流量镜像方法、装置、设备和计算机存储介质