[发明专利]音频分离模型的训练方法、音频信号的分离方法及装置有效
申请号: | 202010357087.3 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111540375B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 邢照亮;张卓;陈新;谢将剑;张军国;杨俊 | 申请(专利权)人: | 全球能源互联网研究院有限公司;北京林业大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/24;G10L25/30;G10L19/02;G10L17/26;G06F18/214 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 谢玲 |
地址: | 102200 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 分离 模型 训练 方法 信号 装置 | ||
本申请提供了一种音频分离模型的训练方法、音频信号的分离方法及装置,其中,该方法包括:获取样本音频信号,每个样本音频信号具有对应的空间位置;对所述样本音频信号进行分帧处理,并提取每帧样本音频信号对应的音频特征,将每帧样本音频信号对应的音频特征输入到音频分离模型中,得到所述音频分离模型输出的各个空间位置存在音频信号的概率。根据所述各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,更新所述音频分离模型的模型参数,得到包括训练好的模型参数的音频分离模型。利用本申请中的音频分离模型,能够对存在声音混叠的多数场景下的音频信号进行分离处理,提高了对于音频信号分离的准确性。
技术领域
本申请涉及信号处理技术领域,具体而言,涉及一种音频分离模型的训练方法、音频信号的分离方法及装置。
背景技术
在一些森林或深山等野外场所中,存在较多的遮挡物,例如:数目、巨石、灌木丛等,无法通过观察等方式获取到野外场所中的存在动物的诸多状态,从而无法分析出野外场所中存在的动物种类、数量、栖息地等多种状态信息。
考虑到动物大多能够发出声音,并且声音不会因为遮挡物的存在而消失,故而,可以通过声音识别动物物种或个体等,进而判断出野外场所中存在的动物种类、数量、栖息地,甚至包括动物的年龄、性别、健康状态等多种状态信息。
但是,现有技术中,对森林或深山等野外场所中常见的多种动物及环境声音混叠背景下,动物的识别效果较差。有必要对混叠音频信号进行分离,对分离后的信号进行识别,以提高识别的准确率。现有的混叠信号分离方法或者需要已知信号源的数量、或者需要有纯净的声音来进行训练,难以适合野外环境的源信号分离,不利于基于声音获取野外动物的状态信息。
发明内容
有鉴于此,本申请实施例的目的在于提供一种音频分离模型的训练方法、音频信号的分离方法及装置,能够对存在混叠声音的多数场景下的音频信号进行分离处理,提高了对于音频信号分离的准确性。
第一方面,本申请实施例提供了一种音频分离模型的训练方法,所述训练方法包括:
获取样本音频信号,每个样本音频信号具有对应的空间位置;
对所述样本音频信号进行分帧处理,并提取每帧样本音频信号对应的音频特征;
将每帧样本音频信号对应的音频特征输入到音频分离模型中,得到所述音频分离模型输出的各个空间位置存在音频信号的概率;
根据所述各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,更新所述音频分离模型的模型参数,直至所述音频分离模型输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的模型参数的音频分离模型;
其中,所述音频分离模型用于基于所述样本音频信号输出的所述各个空间位置存在音频信号的概率,确定出所述各个空间位置存在的音频信号,并分离出多个所述音频信号。
一种可选的实施方式中,所述根据所述各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,更新所述音频分离模型的模型参数,直至所述音频分离模型输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的模型参数的音频分离模型,包括:
根据所述音频分离模型基于每帧样本音频信号对应的音频特征输出的各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,确定所述音频分离模型对应的损失函数;
基于所述音频分离模型对应的损失函数,更新所述音频分离模型的模型参数,直至所述音频分离模型输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的模型参数的音频分离模型。
一种可选的实施方式中,所述获取样本音频信号,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全球能源互联网研究院有限公司;北京林业大学,未经全球能源互联网研究院有限公司;北京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010357087.3/2.html,转载请声明来源钻瓜专利网。