[实用新型]一种麦克风阵列语音增强装置有效
申请号: | 201920332391.5 | 申请日: | 2019-03-15 |
公开(公告)号: | CN209880151U | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 王宇芳;童峰;黄惠详;郭秋涵 | 申请(专利权)人: | 厦门大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216 |
代理公司: | 35235 厦门福贝知识产权代理事务所(普通合伙) | 代理人: | 郝学江 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 麦克风阵列 波束 输入端连接 波束对准 扫描装置 语音波束 输出端 质量评估装置 语音增强 增强装置 通道接收信号 结构环境 时延补偿 输出增强 语音信号 质量评估 自对准 会议室 | ||
公开了一种麦克风阵列语音增强装置,其包括麦克风阵列、语音波束扫描装置、波束质量评估装置、波束对准增强装置,麦克风阵列的输出端与语音波束扫描装置的输入端连接,语音波束扫描装置的输出端与波束质量评估装置的输入端连接,波束质量评估的输出端与波束对准增强装置的输入端连接。据此对麦克风阵列各通道接收信号进行时延补偿波束对准增强,并输出增强语音信号,从而实现会议室结构环境下的说话人自对准语音增强。
技术领域
本实用新型涉及麦克风阵列语音信号处理,尤其是涉及一种麦克风阵列语音增强装置。
背景技术
麦克风已经成为各类会议室的必备设备,为了保证会议效果往往在每个会议座位均配备麦克风,会议发言人通过按下麦克风按钮启动对应的麦克风发言,形成会议麦克风装置。但是,在实际会议使用环境中,考虑到会议多人发言、讨论等具体情况,采用这种方式往往无法保证根据会议情况灵活切换;另一方面,当会议参会人数多于麦克风数时会导致使用上的不便。同时,由于麦克风可以拾取拾音范围内的任何声音,因此不可避免地引入背景噪音,从而影响会议效果。
利用多个麦克风组成阵列结合处理而达到智能的语音信号处理可大大提高语音质量。例如可通过传统时延差算法或超分辨方位估计算法获取语音声源方位之后,利用波束形成技术形成一个指向目标说话人的波束来增强该方向的接收信号。因此,麦克风阵列技术可广泛利用于具有嘈杂背景的语音处理场合,例如智能家居、多媒体教室、车载免提电话和助听器等。
需要指出,获得声源方位是麦克风阵列语音增强技术的前提条件。因此,对于会议场景,如何在存在可能的多说话人的情况下实时获得说话人方位信息实现麦克风阵列对准提高语音质量是一个关键问题。
麦克风阵列声源定位技术主要可分为三类:一是基于最大输出功率的可控波束形成的声源定位技术,该方法通过控制波束扫描并选取其中最大能量方法作为声源方向;二是基于高分辨率谱估计的声源定位技术,此方法主要适用于窄带信号,对于语音信号这样的宽带信号,会导致算法运算量增加;三是基于互相关时延估计的声源定位技术,该算法计算量较小、易实现,但是在存在多个说话人的场景效果急剧下降。因此,在人机交互、视频会议等场合波束扫描方法仍然得到较为广泛的应用。
考虑到会议室等相对空间尺寸有限的应用场景,由于会议室墙壁、天花板、桌面等结构反射,往往导致波束扫描方法可以通过扫描获得多个具有较高能量的语音波束。传统的声源处理方法是选择多个波束中能量最大的作为声源方向,进行对准增强,而实际上考虑到室内结构混响的复杂性,特别是在靠近墙壁、桌面或结构拐角处等反射结构处常存在能量较高的强混响语音,因此单纯考虑能量选取的语音波束从语音质量而言往往并非最优,如:从说话人到麦克风阵列的直达语音能量有可能弱于结构反射导致的混响语音,从而影响了对准增强后麦克风阵列输出语音的效果。
实用新型内容
针对传统的声源处理方法是选择多个波束中能量最大的作为声源方向,进行对准增强,而实际上考虑到室内结构混响的复杂性,特别是在靠近墙壁、桌面或结构拐角处等反射结构处常存在能量较高的强混响语音,影响了对准增强后麦克风阵列输出语音的效果。本实用新型提出了一种麦克风阵列语音增强装置,利用语音波束质量评估装置和波束对准增强装置,提高在会议室等有限尺寸的结构空间内的麦克风阵列语音增强性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201920332391.5/2.html,转载请声明来源钻瓜专利网。