[发明专利]混响环境的源分离有效
申请号: | 201780052977.X | 申请日: | 2017-08-28 |
公开(公告)号: | CN109644304B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 王珺 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;G10L21/028;H03H21/00;G10L25/18;G10L25/21;G10L25/06 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 陈甜甜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混响 环境 分离 | ||
1.一种产生用于源分离的重建模型的方法,其特征在于包括:
通过处理器在假定针对至少一个源中的每一个别者的第一麦克风信号分别由至少两个麦克风针对其间仅所述个别者产生声音的时段捕获的情况下基于所述第一麦克风信号学习(103)用于对所述至少一个源与所述至少两个麦克风之间的声路建模的混合参数,且经由非负矩阵分解方法通过将每一源的所述第一麦克风信号的功率谱图视为所述源的功率谱图而学习所述至少一个源的频谱基;及
通过所述处理器在假定第二麦克风信号分别由所述至少两个麦克风针对其间所述至少一个源中的全部产生声音的时段捕获的情况下基于所述混合参数、所述频谱基及所述第二麦克风信号估计(105)所述重建模型,其中所述重建模型经调适以重建所述麦克风上的所述至少一个源的空间图像,且其中将针对所述至少一个源中的每一者的所述混合参数特性化为所述麦克风上的所述源的空间图像与所述麦克风中的参考者上的所述源的所述空间图像之间的比率。
2.根据权利要求1所述的方法,其特征在于将针对每一源的所述混合参数特性化为所述源的空间协方差。
3.根据权利要求2所述的方法,其特征在于其包括:
通过所述处理器经由判别式非负矩阵分解方法基于所述第一麦克风信号学习(403)所述至少一个源的频谱基,及
其中所述重建模型的所述估计包括基于所述混合参数、所述频谱基及所述第二麦克风信号估计(405)所述重建模型。
4.根据权利要求3所述的方法,其特征在于在每一源的功率谱图收敛的条件下完成所述重建模型的所述估计,及
所述重建模型的所述估计包括经由非负矩阵分解方法基于所述频谱基细化(1305)所述功率谱图。
5.根据权利要求2所述的方法,其特征在于在每一源的功率谱图收敛的条件下完成所述重建模型的所述估计,及
所述重建模型的所述估计包括从所述源的所述混合参数及所述源的空间图像的经估计协方差导出所述功率谱图。
6.根据权利要求1到5中的任一权利要求所述的方法,其特征在于所述重建模型经调适以重建所述至少一个源中的每一者的源信号。
7.根据权利要求6所述的方法,其特征在于其进一步包括:
通过所述处理器经由判别式非负矩阵分解方法基于所述第一麦克风信号确定所述至少一个源中的每一者的频谱基,及
其中所述重建模型的所述估计包括基于所述混合参数、所述频谱基及所述第二麦克风信号估计所述重建模型。
8.根据权利要求7所述的方法,其特征在于在所述至少一个源中的每一者的功率谱图收敛的条件下完成所述重建模型的所述估计,及
所述重建模型的所述估计包括从所述至少一个源的经估计协方差导出所述功率谱图。
9.根据权利要求7所述的方法,其特征在于针对所述至少一个源中的每一者,所述频谱基的所述确定包括:
基于多个预定频谱基中的每一者及所述源的所述第一麦克风信号,估计所述源,其中所述预定频谱基是来自已知源的集合的经预学习频谱基;及
选择与所述源最近似的经估计源中的一者;及
将用于估计选定经估计源的所述预定频谱基设置为要确定的所述频谱基。
10.根据权利要求1到5中的任一权利要求所述的方法,其进一步包括:
捕获所述第一麦克风信号及/或所述第二麦克风信号。
11.根据权利要求1到5中的任一权利要求所述的方法,其进一步包括:
通过所述处理器通过应用所述重建模型而执行源分离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780052977.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:对发声体作出动作的机器人
- 下一篇:用于管理信号路径中的失真的设备和方法