[发明专利]用于音频场景分类的音频处理装置及其方法在审
申请号: | 201880099051.0 | 申请日: | 2018-12-21 |
公开(公告)号: | CN112955954A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 耶塞妮娅·拉库蒂尔·帕罗蒂;弗洛里安·艾本;安德里亚·克雷斯皮;邓军 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王君;肖鹂 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 场景 分类 处理 装置 及其 方法 | ||
1.一种音频处理装置(200),被配置为将音频信号分类为一个或多个音频场景类别,所述音频信号包括分量信号,其特征在于,所述装置(200)包括被配置为执行以下操作的处理电路:
将所述音频信号的所述分量信号分类为前景层分量信号或背景层分量信号;
基于所述音频信号获得音频信号特征;
根据对所述分量信号的所述分类,选择第一权重集或第二权重集;以及
基于所述音频信号特征、所述前景层分量信号或所述背景层分量信号以及所述选择的权重集,对所述音频信号进行分类。
2.根据权利要求1所述的装置(200),其特征在于,所述处理电路被配置为:在所述音频信号的所述分量信号具有短期音频事件或长期音频事件时,将所述音频信号的所述分量信号分类为前景层分量信号;
或,
在所述音频信号的所述分量信号不具有短期音频事件和长期音频事件时,将所述音频信号的所述分量信号分类为背景层分量信号。
3.根据权利要求2所述的装置(200),其特征在于,所述处理电路被配置为:将所述音频信号划分为多个帧,并通过针对所述音频信号的每个帧确定复数域差CDD来对所述音频信号的所述分量信号进行分类。
4.根据权利要求3所述的装置(200),其特征在于,所述CDD是基于以下等式来确定的:
其中,n表示帧索引,k表示频率位索引,N表示样本中的帧大小,并且其中,频谱XT(n,k)定义为:
其中,ψ'(n-1,k)=ψ(n,k)-ψ(n-1,k)表示第k频率位中的相位差。
5.根据权利要求3所述的装置(200),其特征在于,所述处理电路被配置为:针对所述音频信号的每个帧向所述CDD应用高通滤波器,并将所述高通滤波后的CDD中的峰值识别为短期音频事件。
6.根据权利要求4或5所述的装置(200),其特征在于,所述处理电路被配置为:针对所述音频信号的每个帧向所述CDD应用低通滤波器,并通过确定低通滤波后的CDD中的峰值来识别长期音频事件。
7.根据权利要求1至6中任一项所述的装置(200),其特征在于,所述处理电路被配置为:将所述音频信号从时域变换到频域,并在频域中从所述音频信号获得所述音频信号特征。
8.根据权利要求7所述的装置(200),其特征在于,所述音频信号特征包括所述音频信号的对数梅尔频谱。
9.根据权利要求1至8中任一项所述的装置(200),其特征在于,所述处理电路被配置为提供神经网络(220),其中,所述神经网络(200)被配置为执行所述音频信号的所述分类。
10.根据权利要求9所述的装置(200),其特征在于,所述神经网络(200)包括第一神经子网络(221)和第二神经子网络(223),其中,所述第一神经子网络(221)被配置为根据所述分量信号的所述分类来将所述第一权重集或所述第二权重集提供给所述第二神经子网(223),并且,所述第二神经子网(223)被配置为基于所述音频信号特征、所述前景层分量信号或所述背景层分量信号以及由所述第一神经子网络(221)提供的所述选择的权重集来对所述音频信号进行分类。
11.一种音频处理方法(700),其特征在于,将音频信号分类为一个或多个音频场景类别,所述音频信号包括分量信号,所述方法(700)包括:
将所述分量信号分类(701)为前景层分量信号或背景层分量信号;
基于所述音频信号获得(703)音频信号特征;
根据对所述分量信号的所述分类,选择(705)第一权重集或第二权重集;以及
基于所述音频信号特征、所述前景层分量信号或所述背景层分量信号以及所述选择的权重集,对所述音频信号进行分类(707)。
12.一种计算机程序产品,其特征在于,包括用于在计算机或处理器上执行的如权利要求11所述的方法(700)的程序代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880099051.0/1.html,转载请声明来源钻瓜专利网。