[发明专利]音频检测方法、装置、计算机设备、存储介质在审
申请号: | 202210224726.8 | 申请日: | 2022-03-07 |
公开(公告)号: | CN114582325A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 崔洋洋;余俊澎;王星宇 | 申请(专利权)人: | 游密科技(深圳)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/48;G10L25/51 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 曾情 |
地址: | 518051 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 检测 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种音频检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取音频数据;将所述音频数据进行分段处理得到多个音频序列;对所述多个音频序列分别进行检测;若所述音频序列中存在异常音频数据,则对所述存在异常音频数据的所述音频序列求取异常分数;根据所述异常分数输出音频检测报告。采用本方法能够提高音频检测的准确性。
技术领域
本申请涉及计算机应用领域,特别是涉及一种音频检测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
由于声音信息可在光线较差、视觉盲区等场景下使用,因此音频异常检测技术是对现有视频监控系统的重要补充。由于应用场景下发生故障的异常声音稀缺,传统的二分类模型在检测时容易出现漏检。
发明内容
基于此,有必要针对上述技术问题,提供一种音频检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种音频检测方法。所述方法包括:
获取音频数据;
将所述音频数据进行分段处理得到多个音频序列;
对所述多个音频序列分别进行检测;
若所述音频序列中存在异常音频数据,则对所述存在异常音频数据的所述音频序列求取异常分数;
根据所述异常分数输出音频检测报告。
在其中一个实施例中,所述将所述音频数据进行分段处理得到多个音频序列,包括:
根据预设的帧长,对所述音频数据进行分帧处理,得到相同帧长的多个音频序列。
在其中一个实施例中,所述对所述多个音频序列分别进行检测,包括:
计算音频序列的频谱能量;
通过所述频谱能量检测所述多个音频序列。
在其中一个实施例中,所述若所述音频序列中存在异常音频数据,则对所述存在异常音频数据的所述音频序列求取异常分数,包括:
对所述存在异常音频数据的所述音频序列进行特征提取,得到所述存在异常音频数据的所述音频序列的第一声学特征;
调取第一检测模型,将所述第一声学特征输入所述第一检测模型求取异常分数。
在其中一个实施例中,所述调取第一检测模型,将所述第一声学特征输入所述第一检测模型求取异常分数,包括:
计算所述第一声学特征与存储器中的异常音频数据的声学特征之间的第一相似度;
将所述第一声学特征输入预设的异常检测器计算异常程度分数;
利用所述第一相似度和所述异常程度分数求取异常分数。
在其中一个实施例中,上述方法还包括:
若所述音频序列中不存在异常音频数据,则将所述多个音频序列进行声学特征提取,得到所述多个音频序列中每个音频序列对应的第二声学特征;
将所述第二声学特征输入第二检测模型,计算所述多个音频序列之间的第二相似度;
根据所述第二相似度求取异常分数。
第二方面,本申请还提供了一种音频检测装置。所述装置包括:
数据获取模块,用于获取音频数据;
处理模块,用于将所述音频数据进行分段处理得到多个音频序列;
检测模块,用于对所述多个音频序列分别进行检测;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于游密科技(深圳)有限公司,未经游密科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210224726.8/2.html,转载请声明来源钻瓜专利网。