[发明专利]音频分离模型的训练方法、音频信号的分离方法及装置有效
申请号: | 202010357087.3 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111540375B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 邢照亮;张卓;陈新;谢将剑;张军国;杨俊 | 申请(专利权)人: | 全球能源互联网研究院有限公司;北京林业大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/24;G10L25/30;G10L19/02;G10L17/26;G06F18/214 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 谢玲 |
地址: | 102200 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 分离 模型 训练 方法 信号 装置 | ||
1.一种音频分离模型的训练方法,其特征在于,所述训练方法包括:
获取样本音频信号,每个样本音频信号具有对应的空间位置;
对所述样本音频信号进行分帧处理,并提取每帧样本音频信号对应的音频特征;
将每帧样本音频信号对应的音频特征输入到音频分离模型中,得到所述音频分离模型输出的各个空间位置存在音频信号的概率;
根据所述各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,更新所述音频分离模型的模型参数,直至所述音频分离模型输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的模型参数的音频分离模型;
其中,所述音频分离模型用于基于所述样本音频信号输出的所述各个空间位置存在音频信号的概率,确定出所述各个空间位置存在的音频信号,并分离出多个所述音频信号。
2.根据权利要求1所述的音频分离模型的训练方法,其特征在于,所述根据所述各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,更新所述音频分离模型的模型参数,直至所述音频分离模型输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的模型参数的音频分离模型,包括:
根据所述音频分离模型基于每帧样本音频信号对应的音频特征输出的各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,确定所述音频分离模型对应的损失函数;
基于所述音频分离模型对应的损失函数,更新所述音频分离模型的模型参数,直至所述音频分离模型输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的模型参数的音频分离模型。
3.根据权利要求2所述的音频分离模型的训练方法,其特征在于,所述获取样本音频信号,包括:
获取音频采集装置采集的样本音频信号;其中,所述音频采集装置包括第一音频采集装置和第二音频采集装置,所述第一音频采集装置和第二音频装置相邻设置;所述样本音频信号包括:第一音频采集装置采集的第一样本音频信号和第二音频采集装置采集的第二样本音频信号;所述音频分离模型包括第一网络和第二网络,所述第一样本音频信号用于训练所述音频分离模型的第一网络;所述第二样本音频信号用于训练所述音频分离模型的第二网络。
4.根据权利要求2所述的音频分离模型的训练方法,其特征在于,所述根据所述音频分离模型基于每帧样本音频信号对应的音频特征输出的各个空间位置存在音频信号的概率以及每个样本音频信号对应的空间位置,确定所述音频分离模型对应的损失函数,包括:
根据所述音频分离模型的第一网络输出的各个空间位置存在音频信号的概率和每个第一样本音频信号对应的第一空间位置,确定所述第一网络对应的第一损失函数;
根据所述音频分离模型的第一网络输出的各个空间位置存在音频信号的概率和每个第一样本音频信号对应的第一空间位置以及所述音频分离模型的第二网络输出的各个空间位置存在音频信号的概率和每个第二样本音频信号对应的第二空间位置,确定第二损失函数;
根据所述第一损失函数和所述第二损失函数,确定所述音频分离模型对应的损失函数。
5.根据权利要求2所述的音频分离模型的训练方法,其特征在于,所述基于所述音频分离模型对应的损失函数,更新所述音频分离模型的模型参数,直至所述音频分离模型输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的模型参数的音频分离模型,包括:
基于所述音频分离模型对应的损失函数,更新所述音频分离模型中第一网络的第一模型参数,直至所述第一网络输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的第一模型参数;
基于所述音频分离模型对应的损失函数,更新所述音频分离模型中第二网络的第二模型参数,直至所述第二网络输出的各个空间位置存在音频信号的概率与每个样本音频信号对应的空间位置相匹配,得到包括训练好的第二模型参数;
将包括训练好的第一模型参数作为所述音频分离模型的模型参数,或者,将包括训练好的第二模型参数作为所述音频分离模型的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全球能源互联网研究院有限公司;北京林业大学,未经全球能源互联网研究院有限公司;北京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010357087.3/1.html,转载请声明来源钻瓜专利网。