[发明专利]估计声音信号的直接混响比在审
申请号: | 202110148911.9 | 申请日: | 2021-02-03 |
公开(公告)号: | CN113299316A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | R·朱拉达 | 申请(专利权)人: | 苏黎世大学;索诺瓦公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L21/0208;G10L21/0216;G10L25/30;G06N20/00 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜 |
地址: | 瑞士*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 估计 声音 信号 直接 混响 | ||
1.一种用于估计声音信号(30)的直接混响比(38)的方法,其中,所述直接混响比(38)指示从声源接收到的直接声音与从所述声源的环境中的反射接收到的混响声音之间的比,所述方法包括:
针对第一时间帧确定声音信号(30)的第一能量值;
如果所述第一时间帧的所述第一能量值与先前的第二时间帧的第二能量值的差大于阈值,则向所述第一时间帧的开始值指派正值,否则指派零值;
通过将包括所述开始值的开始信号(42)提供给机器学习算法(44)来确定所述直接混响比(38),所述机器学习算法(44)已经被训练以基于所述开始信号确定所述直接混响比(38)。
2.根据权利要求1所述的方法,
其中,所述开始信号(42)在时间上被积分,确定所述开始信号(42)的梯度(52)并且将所述梯度(52)提供给所述机器学习算法(44)。
3.根据权利要求2所述的方法,
其中,通过状态空间模型确定积分的开始信号(48)的所述梯度(52)。
4.根据前述权利要求中的一项所述的方法,
其中,所述机器学习算法(44)包括线性回归模型(54)。
5.根据前述权利要求中的一项所述的方法,
其中,针对所述第一时间帧确定宽带能量值,所述宽带能量值指示所述声音信号(30)在所述第一时间帧中的能量;
其中,当所述第一时间帧的所述宽带能量值比所述先前的第二时间帧的所述宽带能量值高出超过宽带阈值时,通过将针对所述第一时间帧的宽带开始信号(42a)的宽带开始值设置为正值来确定所述宽带开始信号(42a)。
6.根据前述权利要求中的一项所述的方法,
其中,针对所述第一时间帧确定频带能量值,所述频带能量值指示所述声音信号(30)在所述第一时间帧中的频带中的能量;
其中,当所述第一时间帧的所述频带能量值比所述先前的第二时间帧的所述频带能量值高出超过频带阈值时,通过将针对所述第一时间帧的频带开始信号(42b)的频带开始值设置为正值来确定所述频带开始信号(42b)。
7.根据权利要求6所述的方法,
其中,所述声音信号(30)被划分为多个频带,并且针对每个频带确定频带开始信号(42b)。
8.根据权利要求6或7所述的方法,
其中,所述频带阈值不同于所述宽带阈值;和/或
其中,针对不同频带的频带阈值是不同的。
9.根据前述权利要求中的一项所述的方法,
其中,开始值被设置为的所述正值为1;或者
其中,所述正值是所述第一时间帧中的能量值与所述先前的第二时间帧中的能量值的差。
10.根据前述权利要求中的一项所述的方法,
其中,在正值被设置为1的情况下确定宽带开始信号(42a);
其中,在正值被设置为1的情况下确定针对多个频带的多个第一频带开始信号(42c);
其中,在正值被设置为所述第一时间帧中的所述能量值与所述先前的第二时间帧中的所述能量值的所述差的情况下确定针对所述多个频带的多个第二频带开始信号(42b);
其中,所述宽带开始信号(42a)、所述第一频带开始信号(42c)和所述第二频带开始信号(42b)被输入到所述机器学习算法中。
11.一种用于操作听力设备(10)的方法,所述方法包括:
利用所述听力设备(10)的麦克风(18)生成声音信号(30);
根据前述权利要求中的一项,估计所述声音信号(30)的直接混响比(38);
使用所述直接混响比(38)处理所述声音信号(30)以补偿所述听力设备(10)的用户的听力损失;
将处理后的声音信号(32)输出到所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏黎世大学;索诺瓦公司,未经苏黎世大学;索诺瓦公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110148911.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于耳机的夹耳结构
- 下一篇:一种电动车充电器自断电系统