[发明专利]生物声音事件检测模型训练方法、声音事件的检测方法有效
申请号: | 202111012585.5 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113724733B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 龙艳花;唐甜甜;李轶杰 | 申请(专利权)人: | 上海师范大学;云知声(上海)智能科技有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/51;G06N3/0464;G06F18/214 |
代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 付钦伟 |
地址: | 200233 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物 声音 事件 检测 模型 训练 方法 | ||
本发明公开了一种生物声音事件检测模型训练方法、声音事件的检测方法。其中,该信号浪涌保护电路包括:在预训练阶段,首先将录制的包含生物声音事件的原始音频(样本音频)重采样,然后提取手工特征(第一特征矩阵)送入高维特征提取器,利用输出的高维特征向量计算出类原型,接着实现度量分类。为了提高系统泛化能力设计的嵌入传播模块,用在系统训练的第二阶段,在第二阶段的微调训练过程中,高维特征提取器输出的高维特征向量先经过嵌入传播得到嵌入插值向量(第二特征向量),再计算类原型来实现度量分类,进而解决了现有技术中,生物声音事件检测训练模型在训练过程中,模型的鲁棒性较差的技术问题。
技术领域
本发明涉及人工智能(AI)技术与声音事件检测领域技术领域,具体而言,涉及一种生物声音事件检测模型训练方法、声音事件的检测方法。
背景技术
随着深度学习方法在计算机视觉任务中取得的优异性能,如分类、语义分割和目标检测等,加快了人工智能的发展。与此同时,视觉领域的发展已经不能满足日渐提高的智能生活化水平,日常生活场景中对智能语音技术的应用需求越来越多样化,例如,声音场景分类,机器异常声音事件检测,声音事件定位,家居事件声音活动检测,音频信号文本内容识别,稀有生物声音事件检测等。
其中,声音场景分类旨在通过周围的声学环境辨析出设备所处的场所,不同场所不仅在观感上不同,在听感上也有很大差异,例如,火车鸣笛声大概率不会出现在办公室;机器异常声音事件检测是指对机器的运转声音进行实时监测,以对机器发生故障时做出及时警报,可以大大减少人工巡视的成本;声音事件定位旨在通过声音获取声音场景的时空特性实现智能应用程序场景可视化,可以用于广泛的机器认知任务,如推理类型的导航任务中;家居事件声音活动监测则专门服务于家居智能化的实现,对家庭中的各种声音事件进行监测来为后续设备的应对措施做准备;音频信号文本识别常见于音视频中的字幕功能;稀有生物声音事件检测是为了帮助生物研究工作者辨析物种在自然界中的存在,为后续研究做准备,在这种情况下,物种的标记数据尤其难以获得。
然而,有监督的深度学习方法往往需要在大量标记数据上进行训练,对大多数应用程序来说,标记数据是稀缺的,而且它的收集成本很高,例如稀有物种的生物声音事件检测和用户定制化的声音事件检测。声音事件检测存在广泛的现实应用场景,相应的,应用少量先验知识的声音事件检测技术能够为声音事件检测任务带来极大的便利,但同时又存在极大的挑战。在探究声音事件检测算法过程中,在声音事件检测任务仅能提供少量目标样本数据的情况下,为了得到更有效的高维特征表示往往需要深层网络来代替简单的浅层卷积神经网络,而深层网络在与测试数据不匹配的少样本训练数据上学习到的固定高维特征提取模型会带来过拟合问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种生物声音事件检测模型训练方法、声音事件的检测方法,以至少解决现有技术中,生物声音事件检测训练模型在训练过程中,模型的鲁棒性较差的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学;云知声(上海)智能科技有限公司,未经上海师范大学;云知声(上海)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111012585.5/2.html,转载请声明来源钻瓜专利网。