[发明专利]音频相似性评估器、音频编码器、方法和计算机程序在审
申请号: | 201980049602.7 | 申请日: | 2019-05-29 |
公开(公告)号: | CN112470220A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 萨沙·迪施;史蒂文·范·德·帕;安德烈·尼德迈尔;埃琳娜·伯迪埃尔·佩雷斯;贝恩德·埃德勒 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L19/22;G10L21/0388;G10L25/18 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 相似性 评估 编码器 方法 计算机 程序 | ||
1.一种音频相似性评估器(100;200;340),
其中所述音频相似性评估器被配置为基于输入音频信号(110;210;362)获得针对多个频率范围的包络信号(122a-122c;222a-222e),以及
其中,所述音频相似性评估器被配置为获得与针对多个调制频率范围的包络信号相关联的调制信息(162a-162c;262a-262e),其中,所述调制信息描述所述包络信号的调制;以及
其中,所述音频相似性评估器被配置为将所获得的调制信息和与参考音频信号(310)相关联的参考调制信息(182a-182c;282a-282e)进行比较,以便获得关于所述输入音频信号与所述参考音频信号之间的相似性的信息(112;212;342)。
2.根据权利要求1所述的音频相似性评估器(100;200;340),其中,所述音频相似性评估器被配置为应用具有重叠滤波器特性的多个滤波器或滤波操作(230),以便获得所述包络信号(122a-122c;222a-222e)。
3.根据权利要求1或权利要求2所述的音频相似性评估器(100;200;340),其中,所述音频相似性评估器被配置为将整流(236)应用于滤波器或滤波操作(230)的输出信号(232a-232e),以获得多个整流信号(238),或者其中所述音频相似性评估器被配置为基于滤波器或滤波操作(230)的输出信号(232a-232e)获得希尔伯特包络,或者其中所述音频相似性评估器被配置为对滤波器或滤波操作(230)的输出信号(232a-232e)进行解调。
4.根据权利要求3所述的音频相似性评估器(100;200;340),其中,所述音频相似性评估器被配置为将低通滤波器或低通滤波(240)应用于所述整流信号(238)。
5.根据权利要求1至4中的一项所述的音频相似性评估器(100;200;340),其中,所述音频相似性评估器被配置为应用自动增益控制(250),以便获得所述包络信号(222a至222e),或者应用对数变换,以便获得所述包络信号(222a至222e),或者应用前向掩蔽的建模,以便获得所述包络信号(222a至222e)。
6.根据权利要求5所述的音频相似性评估器(100;200;340),其中,所述音频相似性评估器被配置为改变被应用于基于经整流和低通滤波的信号(242)导出所述包络信号(222a至222e)的增益,所述经整流和低通滤波的信号(242)是通过多个滤波器或滤波操作(240)基于所述输入音频信号提供的。
7.根据权利要求1至6中的一项所述的音频相似性评估器(100;200;340),其中,所述音频相似性评估器被配置为使用一系列的两个或更多个适配环路(254,256,257),处理通过多个滤波器或滤波操作(230)基于所述输入音频信号(210)提供的信号(232a至232e)的经整流和低通滤波的版本(242),所述两个或更多个适配环路(254,256,257)根据时变增益值(258)来应用时变缩放,
其中所述音频相似性评估器被配置为使用不同的时间常数来调整不同的时变增益值(258)。
8.根据权利要求1至7中的一项所述的音频相似性评估器(100;200;340),
其中所述音频相似性评估器被配置为将具有不同通带的多个调制滤波器(264)应用于所述包络信号(222a至222e),以获得所述调制信息(262a至262e),和/或其中所述音频相似性评估器被配置为将下采样应用于所述包络信号(222a至222e),以获得所述调制信息(262a至262e)。
9.根据权利要求8所述的音频相似性评估器(100;200;340),其中,所述调制滤波器(264)被配置为至少部分地分离所述包络信号(222a-222e)的具有不同频率的分量,其中,第一最低频率调制滤波器的中心频率低于5Hz,以及其中最高频率调制滤波器的中心频率在200Hz和300Hz之间的范围内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980049602.7/1.html,转载请声明来源钻瓜专利网。