[发明专利]音频信号的处理方法、装置、设备和存储介质在审

申请号：	202010753656.6	申请日：	2020-07-30
公开（公告）号：	CN111883151A	公开（公告）日：	2020-11-03
发明（设计）人：	刘青松	申请（专利权）人：	云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
主分类号：	G10L21/02	分类号：	G10L21/02;G10L21/028;G10L21/0356
代理公司：	暂无信息	代理人：	暂无信息
地址：	100096 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频信号处理方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种音频信号的处理方法、装置、设备和存储介质，方法包括确定视频采集设备的视场范围；从采集的所有音频信号中选取位于视频采集设备的视场范围内的待处理音频信号后，对所述待处理音频信号进行增强处理，得到增强音频信号。本发明的技术方案实现了利用视场和声音结合的方式对特定目标、特定方向、特定区域范围的声源定位和增强处理，从而提高了音频信号处理的灵活性、准确性。

技术领域

本发明涉及信号处理技术领域，尤其涉及一种音频信号的处理方法、装置、设备和存储介质。

背景技术

通话设备在实际使用环境中容易受到背景噪音和混响等干扰，使音频信号的质量和可懂度受到影响，因此在许多通话应用中都需要进行有效的音频信号增强处理，以抑制噪声，提高音频的清晰度、可懂度和舒适度。

目前，最常用的麦克风阵列语音增强技术是利用麦克风阵列接收到的音频信号里包含的空间相位信息对输入语音进行空间滤波，形成具有指向性的空间波束，对指定方向上的音频信号进行增强。

但是，当使用环境中存在多个声源时，传统的来波方向估计只能选择声音最强的声源进行增强，而其他声源无法被增强，或者，无法对特定的声源信号、特定区域范围内的声源信号进行增强，从而降低了音频信号处理的灵活性、准确性。

发明内容

有鉴于此，本发明的目的在于提出一种音频信号的处理方法、装置、设备和存储介质，以解决音频信号处理的灵活性、准确性较低的问题。

基于上述目的，本发明提供了一种音频信号的处理方法，包括：

确定视频采集设备的视场范围；

从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号；

对所述待处理音频信号进行增强处理，得到增强音频信号。

进一步地，上述所述的音频信号的处理方法中，确定视频采集设备的视场范围，包括：

获取所述视频采集设备的采集参数；

根据所述视频采集设备的采集参数，确定所述视场范围。

进一步地，上述所述的音频信号的处理方法中，所述视频采集设备的采集参数包括所述视频采集设备的拍摄方向和/或成像倍数。

进一步地，上述所述的音频信号的处理方法中，从采集的所有音频信号中选取位于所述视场范围内的待处理音频信号，包括：

根据视频采集设备和麦克风阵列的相对位置，确定所述视场范围对应的视频画面中像素坐标与麦克风阵列的来波方向之间的映射关系；其中，所述麦克风阵列用于采集音频信号；

提取所述视频画面中唇部坐标；

根据像素坐标与麦克风阵列的来波方向之间的映射关系，确定所述唇部坐标对应的来波方向；

从所有音频信号的来波方向中选取与所述唇部坐标对应的来波方向一致的音频信号作为所述待处理音频信号。

进一步地，上述所述的音频信号的处理方法中，对所述待处理音频信号进行增强处理，得到增强音频信号，包括：

将所有待处理音频信号进行积分处理，得到目标音频信号；

根据所述目标音频信号和所有音频信号，确定待抑制音频信号；

根据所述目标音频信号和所述待抑制音频信号，确定所述目标音频信号的加权权重变换矩阵；

利用所述加权权重变换矩阵对所述目标音频信号进行增强处理，得到所述增强音频信号。

本发明还提供一种音频信号的处理装置，包括：

确定模块，用于确定视频采集设备的视场范围；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司，未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010753656.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频信号的处理方法、装置、设备和存储介质在审

专利文献下载