[发明专利]用于对多声道输入信号内的空间背景噪声进行编码和/或解码的方法和设备在审
申请号: | 202180049679.1 | 申请日: | 2021-06-10 |
公开(公告)号: | CN115867964A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | M·埃克特;R·泰亚吉 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L19/012 | 分类号: | G10L19/012 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 魏小薇;吴丽丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 多声道 输入 信号 空间 背景 噪声 进行 编码 解码 方法 设备 | ||
1.一种用于对包括N个不同声道的多声道输入信号(101)进行编码的方法(600);其中,所述输入信号(101)包括帧序列;其中,所述方法(600)包括:针对所述帧序列中的当前帧,
-使用信号和/或语音活动检测器来确定(601)所述当前帧是活动帧还是非活动帧;
-基于所述多声道输入信号(101)来确定(602)下混信号(103);其中,所述下混信号(103)包括少于或等于N个声道;
-确定(603)包括参数集的上混元数据(105),所述参数集用于基于所述下混信号(103)生成包括N个声道的重建多声道信号(111);其中,所述上混元数据(105)是根据所述当前帧是活动帧还是非活动帧来确定的;以及
-将所述上混元数据(105)编码(604)为比特流。
2.如权利要求1所述的方法(600),其中,所述方法(600)包括
-根据所述当前帧是活动帧还是非活动帧,通过在所述帧序列中的多个帧上执行时间平滑,确定所述多声道输入信号(101)的当前帧的协方差,特别是协方差矩阵;以及
-基于所述当前帧的协方差来确定所述上混元数据(105)的一个或多个参数。
3.如权利要求2所述的方法(600),其中,
-所述时间平滑的遗忘因子取决于所述当前帧是活动帧还是非活动帧;和/或
-如果所述当前帧是活动帧,则与所述当前帧是非活动帧的情况相比,所述遗忘因子更短;和/或
-如果所述当前帧是活动帧,则与所述当前帧是非活动帧的情况相比,时间平滑的量更少。
4.如权利要求3所述的方法(600),其中,所述协方差的时间平滑的遗忘因子与频率相关。
5.如权利要求2至4中任一项所述的方法(600),其中,所述方法(600)包括
-从所述帧序列中识别与瞬变噪声或谈话突发相对应的一个或多个帧;以及
-在执行时间平滑时忽略一个或多个识别出的帧,和/或从用于确定所述当前帧的协方差的时间平滑计算中移除所述一个或多个识别出的帧。
6.如权利要求2至5中任一项所述的方法(600),其中,所述方法(600)包括
-确定所述当前帧是在所述帧序列中的一组一个或多个先前非活动帧之后相隔小于预定突发持续时间阈值的活动帧;以及
-在不考虑所述当前帧的情况下确定所述当前帧的协方差。
7.如权利要求6所述的方法(600),其中,所述当前帧的协方差是基于参考协方差确定的,所述参考协方差是基于所述一组一个或多个先前非活动帧确定的。
8.如权利要求2至5中任一项所述的方法(600),其中,所述方法(600)包括
-确定所述当前帧是在所述帧序列中的一组一个或多个先前非活动帧之后相隔大于预定突发持续时间阈值的活动帧;以及
-基于来自所述当前帧的样本、特别是仅基于所述样本确定所述当前帧的协方差。
9.如权利要求2至5中任一项所述的方法(600),其中,所述方法(600)包括
-确定所述当前帧是非活动帧;以及
-将所述当前帧的协方差存储为参考协方差,以执行时间平滑从而确定所述帧序列中在所述当前帧之后的后续帧的协方差。
10.如权利要求2至9中任一项所述的方法(600),其中,所述方法(600)包括:针对所述帧序列中在所述当前帧之后的后续帧,并且在所述当前帧是非活动帧的情况下,
-使用所述信号和/或所述语音活动检测器来确定所述后续帧是活动帧还是非活动帧;
-如果所述后续帧是非活动帧,则基于所述当前帧的样本、特别是基于所述当前帧的协方差并且基于所述后续帧的样本来确定所述后续帧的协方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180049679.1/1.html,转载请声明来源钻瓜专利网。