[发明专利]处理音频信号的方法和装置及计算机可读介质有效
申请号: | 201880005603.7 | 申请日: | 2018-01-03 |
公开(公告)号: | CN110121890B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 黎椿键 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 陈甜甜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 音频 信号 方法 装置 计算机 可读 介质 | ||
1.一种处理音频信号的方法,其包括:
由处理器将经由麦克风阵列捕获的至少两个输入声音通道转换成至少两个中间声音通道,其中所述中间声音通道分别与来自所述麦克风阵列的预定方向相关联,且声源离所述方向越近,所述声源在与所述方向相关联的所述中间声音通道中增强得越多;
由所述处理器基于所述输入声音通道的至少两者的输入声音帧估计到达方向;
由所述处理器单独调平所述中间声音通道;及
由所述处理器将经受调平的所述中间声音通道转换为预定输出通道格式,且其中所述调平包括:
针对所述中间声音通道的至少一个预定中间声音通道中的每一者,
估计所述至少一个预定中间声音通道中的第一声音帧的第一信号质量,其中所述第一声音帧与和所述输入声音帧相同的时间相关联;
如果所述第一信号质量高于第一阈值级且符合以下情况,识别所述第一声音帧:所述到达方向指示所述第一声音帧的声源定位于从所述预定方向的预定范围内,所述预定方向与包含经识别的所述第一声音帧的所述至少一个预定中间声音通道相关联;及
通过应用第一增益朝向第一目标级调节所述经识别的第一声音帧的声级。
2.根据权利要求1所述的方法,其中所述第一目标级及/或所述第一增益分别低于用于调平所述中间声音通道中除了所述至少一个预定中间声音通道外的剩余者的至少一个目标级及/或增益。
3.根据权利要求1或权利要求2所述的方法,其进一步包括:
由所述处理器基于配置数据或用户输入指定所述至少一个预定中间声音通道。
4.根据权利要求1或权利要求2所述的方法,其中所述预定输出通道格式是从由以下各者组成的群组选出:单声道、立体声、5.1声道或更高声道、及一级或更高级环绕声。
5.根据权利要求1或权利要求2所述的方法,其中所述调平进一步包括:
估计所述中间声音通道中除了所述至少一个预定中间声音通道外的至少一者中的第二声音帧的第二信号质量;
如果所述第二信号质量高于第二阈值级,就识别所述第二声音帧;及
通过应用第二增益朝向第二目标级调节所述经识别的第二声音帧的声级。
6.根据权利要求5所述的方法,其中所述麦克风阵列布置于语音记录装置中,
定位于与所述至少一个预定中间声音通道相关联的所述方向上的源比定位于与除了所述至少一个预定中间声音通道外的所述至少一个中间声音通道相关联的所述方向上的另一源更靠近所述麦克风阵列,且
所述第一目标级低于所述第二目标级,及/或所述第一增益低于所述第二增益。
7.根据权利要求6所述的方法,其中所述语音记录装置经调适用于会议系统。
8.根据权利要求5所述的方法,其中所述麦克风阵列布置于包含相机的便携式电子装置中,
所述输入声音通道是在经由所述相机捕获视频期间捕获的,
所述至少一个预定中间声音通道包括与和所述相机的定向相对的方向相关联的反向通道,且
所述中间声音通道中除了所述至少一个预定中间声音通道外的所述至少一者包括相关联于与所述相机的所述定向重合的方向的前向通道。
9.根据权利要求8所述的方法,其中:
所述第一目标级低于所述第二目标级或所述第一增益低于所述第二增益,或者所述第一目标级低于所述第二目标级和所述第一增益低于所述第二增益;或
所述第一目标级高于所述第二目标级或所述第一增益高于所述第二增益,或者所述第一目标级高于所述第二目标级和所述第一增益高于所述第二增益。
10.根据权利要求1或权利要求2所述的方法,其中所述至少两个输入声音通道的所述转换包括:
由所述处理器将波束形成应用于所述输入声音通道上以产生所述中间声音通道。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880005603.7/1.html,转载请声明来源钻瓜专利网。