[发明专利]时延估计方法及装置有效
申请号: | 201710515887.1 | 申请日: | 2017-06-29 |
公开(公告)号: | CN109215667B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 艾雅·苏谟特;李海婷;苗磊 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 罗振安 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 估计 方法 装置 | ||
本申请公开了一种时延估计方法及装置,属于音频处理领域。该方法包括:确定当前帧的多声道信号的互相关系数;根据缓存的至少一个过去帧的声道间时间差信息,确定当前帧的时延轨迹估计值;确定当前帧的自适应窗函数;根据所述当前帧的时延轨迹估计值和所述当前帧的自适应窗函数,对所述互相关系数进行加权,得到加权后的互相关系数;根据所述加权后的互相关系数确定所述当前帧的声道间时间差;解决了互相关系数被过度平滑或平滑不足的问题,提高了估计声道间时间差的准确性。
技术领域
本申请涉及音频处理领域,特别涉及一种时延估计方法及装置。
背景技术
相对于单声道信号来说,由于多声道信号(如立体声信号)更具有方位感和分布感,因此,备受人们青睐。多声道信号是由至少两路单声道信号组成的。例如,立体声信号是两路单声道信号,即左声道信号和右声道信号组成的。对立体声信号进行编码,可以是对立体声信号的左声道信号和右声道信号进行时域下混处理得到两路信号,再对得到的两路信号进行编码,这两路信号分别为:主要声道信号和次要声道信号。其中,主要声道信号用于表征立体声信号中的两路单声道信号之间的相关信息;次要声道信号用于表征立体声信号中的两路单声道信号之间的差异信息。
如果两路单声道信号之间的时延越小,则主要声道信号越大,立体声信号的编码效率越高,编解码质量越好;反之,如果两路的单声道信号之间的时延越大,则次要声道信号越大,立体声信号的编码效率越低,编解码质量越差。为了保证编解码得到的立体声信号有较好的效果,需要估计立体声信号中的两路单声道信号之间的时延,即声道间时间差(ITD,Inter-channle Time Difference),根据估计出的声道间时间差通过时延对齐处理从而使得两路单声道信号之间对齐,增强主要声道信号。
一种典型的时域上的时延估计方法,包括:根据至少一个过去帧的互相关系数,对当前帧的立体声信号的互相关系数进行平滑处理,得到平滑后的互相关系数;从该平滑后的互相关系数中搜索最大值,将该最大值对应的索引值确定为当前帧的声道间时间差。其中,当前帧的平滑因子是根据输入信号的能量或者其它特征自适应调整得到的一个数值。互相关系数,用于指示不同的声道间时间差对应的时延调整后两路单声道信号的互相关程度,其中,互相关系数也可以称作互相关函数。
音频编码设备采用统一的标准(当前帧的平滑因子),对当前帧的所有互相关值进行平滑,可能会导致一部分互相关值被过度平滑;和/或,另一部分互相关值平滑不足的问题。
发明内容
为了解决音频编码设备对当前帧的互相关系数中的互相关值过度平滑,或者平滑不足,导致音频编码设备估计出的声道间时间差不准确的问题,本申请实施例提供了一种时延估计方法及装置。
第一方面,提供了一种时延估计方法,该方法包括:确定当前帧的多声道信号的互相关系数;根据缓存的至少一个过去帧的声道间时间差信息,确定当前帧的时延轨迹估计值;确定当前帧的自适应窗函数;根据当前帧的时延轨迹估计值和当前帧的自适应窗函数,对互相关系数进行加权,得到加权后的互相关系数;根据加权后的互相关系数确定当前帧的声道间时间差。
通过计算当前帧的时延轨迹估计值来预测当前帧的声道间时间差;根据当前帧的时延轨迹估计值和当前帧的自适应窗函数,对互相关系数进行加权;由于自适应窗函数是升余弦窗,具有相对地放大中间部分抑制边缘部分的功能,这就使得根据当前帧的时延轨迹估计值和当前帧的自适应窗函数,对互相关系数进行加权时,离时延轨迹估计值越近,加权系数越大,避免了对第一互相系数过度平滑的问题;离时延轨迹估计值越远,加权系数越小,避免了对第二互相关系数平滑不足的问题;这样,实现了通过自适应窗函数自适应地抑制互相关系数中远离时延轨迹估计值的索引值对应的互相关值,提高了从加权后的互相关系数中确定声道间时间差的准确性。其中,第一互相关系数指互相关系数中时延轨迹估计值附近的索引值对应的互相关值,第二互相关系数指互相关系数中远离时延轨迹估计值的索引值对应的互相关值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710515887.1/2.html,转载请声明来源钻瓜专利网。