[发明专利]声音事件检测模型训练方法及声音事件检测方法在审
申请号: | 201910503277.9 | 申请日: | 2019-06-11 |
公开(公告)号: | CN110223713A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 俞凯;丁翰林 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G06N3/04 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音事件 卷积神经网络 声音特征信息 循环神经网络 下采样 神经元 分类 检测 时间分辨率 模型训练 分界 卷积 配置 申请 输出 清晰 | ||
本申请公开一种声音事件检测模型训练方法,所述声音事件检测模型包括卷积神经网络和循环神经网络,所述方法包括:为所述卷积神经网络的多个卷积层中的至少一个配置下采样层,用于下采样所述卷积神经网络的神经元的时间分辨率;配置所述循环神经网络,用于根据所述卷积神经网络所输出的声音特征信息进行声音事件分类。本申请通过在卷积神经网络进行声音特征信息提取时进行神经元层面的时间分辨率的下采样,从而能够获取事件分界更清晰的声音特征信息,便于后续循环神经网络据此进行声音事件的分类,提高了声音事件分类的准确性,降低了声音事件分类的难度。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种声音事件检测模型训练方法及声音事件检测方法。
背景技术
随着人工智能和深度神经网络在图像,视频,和语音等领域的大火,AI在音频领域,包括场景分类,音频事件检测,网络音视频的应用需求也越来越多。DCASE(Detectionand Classification of Acoustic Scenes and Events)是音频场景和音频事件的分类与检测的简称。DCASE的应用场景十分广泛,如智能家居,无人驾驶,复杂场景中的语音识别等。
SED(声音事件检测)本质上是一个半监督的持续时间估计问题,这意味着在训练期间硬标签(时间戳)不可用。然而,由于缺乏关于事件的先验知识,从弱标签获得合理的持续时间估计是困难的。发明人在实现本申请的过程中发现识别和分析阻碍当前SED的三个关键问题:
1)在训练期间,通过平均池化汇集时间维度来获得弱标签估计。这种方法有利于长事件而忽略了短事件[16];
2)在获得每帧预测之后,使用中值滤波来平滑事件预测,这进一步有益于长事件;
3)神经网络预测是在非常精细的范围内进行的。由于该任务的嘈杂性,后处理是必要的,以便获得连贯的预测。但是,网络无法直接学习后处理。
发明内容
本申请实施例提供一种声音事件检测模型训练方法及声音事件检测方法,用于至少解决上述技术问题之一。
第一方面,本申请实施例提供一种声音事件检测模型训练方法,所述声音事件检测模型包括卷积神经网络和循环神经网络,所述方法包括:
为所述卷积神经网络的多个卷积层中的至少一个配置下采样层,用于下采样所述卷积神经网络的神经元的时间分辨率;
配置所述循环神经网络,用于根据所述卷积神经网络所输出的声音特征信息进行声音事件分类。
第二方面,本申请实施例提供一种声音事件检测方法,其中,包括:
对待检测音频信号进行预处理;
将预处理之后的音频信号输入至本申请任一实施例所述的方法训练得到的声音事件检测模型。
第三方面,本申请实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本申请上述任一项声音事件检测模型训练方法和/或声音事件检测方法。
第四方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请上述任一项声音事件检测模型训练方法和/或声音事件检测方法。
第五方面,本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项声音事件检测模型训练方法和/或声音事件检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910503277.9/2.html,转载请声明来源钻瓜专利网。