[发明专利]一种基于麦克风阵列的语音增强降噪系统在审
申请号: | 202110655571.9 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113450820A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 胡程远 | 申请(专利权)人: | 合肥三恩信息科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/02 |
代理公司: | 合肥律众知识产权代理有限公司 34147 | 代理人: | 赵娟 |
地址: | 230000 安徽省合肥市高新区创新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 麦克风 阵列 语音 增强 系统 | ||
本发明公开了一种基于麦克风阵列的语音增强降噪系统,涉及语音处理技术领域,该系统包括:麦克风,所述麦克风用于采集用户语音,所述麦克风的数量为多个且组成麦克风阵列;视觉传感器,所述视觉传感器用于采集用户位置信息,所述视觉传感器的数量为多个且组成视觉传感器阵列;控制模块,分别与麦克风和视觉传感器电性连接,用于接收麦克风和视觉传感器的数据。本发明通过设置麦克风阵列和与之配合的视觉传感器,从而可以检测人所在的位置,并增强人发出的声音,而屏蔽非人所在位置的噪音。本发明通过模块划分噪音区域和重叠语音区域,并通过三个区域内不同优先级的声音进行语音和噪音的判定,增强输出语音而屏蔽噪音。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种基于麦克风阵列的语音增强降噪系统。
背景技术
工厂、医院等是噪声的集中区域,在工厂中,例如各种机器工作时会产生强烈的噪声,严重影响工人之间的沟通和工作效率,在医院中,在核磁共振扫描时,由于梯度切换产生强大的机械噪声,使得医生与患者的语音对讲系统受到梯度噪声强烈干扰。
随着语音处理技术的发展,语音增强,又称作语音降噪,是指从被噪声污染的信号中恢复出原始的语音信号,从而提高语音信号的可懂度和清晰度。大部分语音增强技术一般是将原始信号的功率谱和估计出的噪声信号功率谱直接相减,但是其对于噪音的检测较为粗略,尤其是针对是否为人发出的语音和非人产生的噪音判断不够准确,不利于在工厂或医院等人机共存的场合交流。
发明内容
本发明的目的是为了解决上述的问题,而提出的一种基于麦克风阵列的语音增强降噪系统。
为了实现上述目的,本发明采用了如下技术方案:
一种基于麦克风阵列的语音增强降噪系统,该系统包括:
麦克风,所述麦克风用于采集用户语音,所述麦克风的数量为多个且组成麦克风阵列;
视觉传感器,所述视觉传感器用于采集用户位置信息,所述视觉传感器的数量为多个且组成视觉传感器阵列;
控制模块,分别与麦克风和视觉传感器电性连接,用于接收麦克风和视觉传感器的数据。
可选地,控制模块对检测到用户所在的视觉传感器的区域定义为语音区域,并对语音区域内所有的声音标记为语音并增强输出;
对未检测到用户的区域定义为噪音区域,并对噪音区域内所有的声音标记为噪音,该噪音不包括语音区域内优先检测到的声音;
对检测到用户所在的视觉传感器之间的重叠区域定义为重叠语音区域,并对重叠语音区域内所有的语音剔除噪音区域内优先检测到的噪音;
对位于最外侧的麦克风同时监测到的声音标记为噪音。
可选地,所述视觉传感器的视觉观测范围为圆形,且观测范围内至少包括四个麦克风。
可选地,所述视觉传感器采用摄像头热红外人体传感器中的一种或多种。
可选地,所述麦克风阵列为矩形阵列,所述视觉传感器阵列为矩形阵列且分布在麦克风阵列之间。
本发明具备以下优点:
本发明通过设置麦克风阵列和与之配合的视觉传感器,从而可以检测人所在的位置,并增强人发出的声音,而屏蔽非人所在位置的噪音。
本发明通过模块划分噪音区域和重叠语音区域,并通过三个区域内不同优先级的声音进行语音和噪音的判定,增强输出语音而屏蔽噪音。
本发明突出的特点在于,适应性广,对于非人的噪音屏蔽效果好,且在人不断走动中,视觉传感器可以根据人所在的位置不断的转换语音区域噪音区域和重叠语音区域,实现始终输出语音区域和重叠语音区域内优先级较高的语音,而屏蔽非人噪音。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥三恩信息科技有限公司,未经合肥三恩信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110655571.9/2.html,转载请声明来源钻瓜专利网。