[发明专利]用于声音的动态范围压缩的方法与装置在审
申请号: | 201710243142.4 | 申请日: | 2017-04-14 |
公开(公告)号: | CN107731236A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 莫迪凯·谢费尔 | 申请(专利权)人: | 阿哈隆·丹尼尔·谢费尔 |
主分类号: | G10L19/005 | 分类号: | G10L19/005;G10L19/012;G10L21/003;G10L21/04;H04R25/00 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 刘宇峰 |
地址: | 以色列*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 声音 动态 范围 压缩 方法 装置 | ||
相关申请的交叉引用
本申请是申请日为2015年10月13日的国际申请PCT/IL2015/051019部分继续申请,该国际申请要求申请日为2014年11月6日的美国临时专利申请62/075,913的优先权,它们两者的说明书都以它们的整体在这里被引入。
技术领域
本发明涉及声音的处理,更特别地涉及声音的动态范围压缩。
背景技术
人耳最大可允许的声音水平能容纳90db而不受损伤。普通日常背景噪声响度能容易达到70db。这意味着:如果我们想要确保一些听力内容对于一个人能被听到,我们必须明白:该内容必须被提供在70dB至90dB响度水平,它是20dB或因子120或动态范围(DR)的在数字项中约7比特。然而,结果是:一个人能被日常暴露的响度水平可超过200dB,它相当于0dB的最小响度水平的1020倍,或DR的33比特。
在声音的动态范围压缩(DRC)方面的现有技术通常包括1:1映射,例如,对数曲线或分段线性输入—输出曲线,其中,新样本值是仅根据原始样本值来确定的。在那些1:1映射中,对于低声音水平的增益显然是基于对于高声音水平的增益的消耗而增加的。这样继而导致洗出效应,它会在高响度水平上大致损害由特定声音传递的语言的、音乐的或诸如此类的知觉的质量。
良好听觉DRC的最迫切需求显现在助听器(HA)上。为了获得在正常背景噪音响度上的满意的听力,用户不得不增加HA的增益到从说话者到趋向发展的麦克风的正反馈的水平,导致危险的高能音调。在另一方面,采用现有的声音DRC方法,弱听力的人将会由于洗出效应而损失在响声上的甚至更多的内容知觉。
发明内容
本发明是一种用于压缩声音的动态范围的装置和方法。
根据本发明所教导的一个具体实施方式,提供了一种用于压缩音频信号的动态范围的方法,所述方法包括:(a)将音频信号乘以一个标量以产生标量相乘形式的音频信号;(b)整流所述音频信号以产生整流形式的音频信号;(c)根据明确定义的函数改变所述整流形式的音频信号,以产生所述改变的整流形式的音频信号;以及(d)基于在所述标量相乘形式的音频信号与所述改变的整流形式的音频信号之间的比率,产生输出信号,以致所得的输出信号具有比所述音频信号的动态范围更小的动态范围。
可选地,所述明确定义的函数是平均函数。
可选地,所述明确定义的函数是最大值函数。
可选地,所述改变的整流形式的音频信号是通过将音频信号传递通过低通滤波器而产生的。
可选地,所述标量相乘形式的音频信号与所述改变的整流形式的音频信号是基于将所述输出信号传递通过反馈环并将输入信号乘以所述音频信号,其中所述输入信号是基于所述反馈环的输出的。
可选地,所述输出信号的动态范围是以第一比特数来表示,而所述音频信号的动态范围是以第二比特数来表示,所述第一比特数是小于所述第二比特数的一半。
可选地,所述音频信号的动态范围是以33比特来表示。
可选地,所述音频信号的动态范围是以7比特来表示。
根据本发明所教导的一个具体实施方式,提供了一种用于压缩音频信号的动态范围的方法,包括:(a)提供反馈环,其将输出信号耦合到输入信号,所述输出信号是部分基于每个所述音频信号和反馈环,所述反馈环包括信号整流和根据明确定义的函数的信号改变;(b)在所述反馈环内整流和改变所述输出信号;(c)从常数值中减去所述整流和改变的输出信号,以产生所述输入信号;以及(d)所述音频信号乘以所述输入信号以产生所述输出信号,以致所得的输出信号具有比所述音频信号的动态范围更小的动态范围。
可选地,所述明确定义的函数是平均函数。
可选地,所述明确定义的函数是最大值函数。
可选地,在所述反馈环中的所述输出信号的所述整流和所述改变是通过将音频信号传递通过低通滤波器而完成的。
可选地,所述输出信号的整流是在所述改变之前进行的。
可选地,所述音频信号的动态范围的压缩率是由在所述音频信号的动态范围与所述输出信号的动态范围之间的比率而给出的,其中,所述压缩率是约等于在所述音频信号的动态范围与所得的音频信号的动态范围之间的比率,所述所得的音频信号是所述音频信号通过人听觉系统处理的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿哈隆·丹尼尔·谢费尔,未经阿哈隆·丹尼尔·谢费尔许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710243142.4/2.html,转载请声明来源钻瓜专利网。