[发明专利]定位汽车内语音源的方法在审
申请号: | 201811525489.9 | 申请日: | 2018-12-13 |
公开(公告)号: | CN111323753A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 孙珏;郑昌龙;应臻奕 | 申请(专利权)人: | 蔚来汽车有限公司 |
主分类号: | G01S5/24 | 分类号: | G01S5/24 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 王星;杨美灵 |
地址: | 中国香港中环*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 定位 汽车 语音 方法 | ||
本发明涉及一种定位汽车内语音源的方法,包括:识别语音源发出的语音,以提取唤醒识别语音;计算唤醒识别语音的波前分别到达不同麦克风阵列的第一时间差;以及至少基于第一时间差和不同麦克风阵列的位置来确定用户所在的位置。其不仅能够准确地进行语音源定位,还能够对驾驶员语音提供更高级别的智能响应,从而确保行车安全。
技术领域
本发明涉及声音检测技术领域,更具体地说,涉及一种定位汽车内语音源的方法。
背景技术
声源定位,即SSL技术,是确定一个声源在空间的位置的方法。常规的SSL方法可采用麦克风阵列来实现,但在应用到车载场景时,会面临很多问题,例如:首先车内有限空间很难实现大量集中式麦克阵列的布局,另外,由于车载环境背景噪音、引擎噪声及风噪等干扰,对声源定位的准确性都带来了诸多困难。
另一方面,关键词唤醒,是用于判断用户语音是否为预定关键词并进而唤醒智能装置或其功能性,通常可作为语音识别的入口,提供后续语音明确的交互意图。关键词唤醒的应用领域比较广泛,例如,机器人、手机、可穿戴设备、智能家居、车载等。带有语音识别功能的智能设备通常都会需要应用关键词唤醒技术作为人和机器互动的一个开始。
发明内容
本发明的一个目的在于提供一种定位汽车内语音源的方法。
为实现上述目的,本发明提供一种技术方案如下:一种定位汽车内语音源的方法,包括:识别语音源发出的语音,以提取唤醒识别语音;计算唤醒识别语音的波前分别到达不同麦克风阵列的第一时间差;以及至少基于第一时间差和不同麦克风阵列的位置来确定用户所在的位置。
可选地,该方法还包括:用户装置基于用户所在的位置对用户语音进行响应。
可选地,该方法还包括:计算唤醒识别语音的波前分别到达不同麦克风阵列的第二时间差;基于第一时间差、第二时间差和不同麦克风阵列的位置来确定用户所在的位置。
可选地,第一时间差为唤醒识别语音的波前分别到达第一麦克风与第二麦克风的时间间隔的统计值,第二时间差为唤醒识别语音的波前分别到达第三麦克风与第四麦克风的时间间隔的统计值。
可选地,计算唤醒识别语音的波前分别到达不同麦克风阵列的第一时间差包括:将唤醒识别语音的波前到达第一麦克风和第二麦克风的第一时域信号和第二时域信号分别转换为第一频域信号和第二频域信号;对第一频域信号和第二频域信号进行交叉频谱计算,以确定第一时间差。
可选地,唤醒识别包括:提取语音源发出的语音的FBANK特征;计算语音的每一帧的后验概率;以及利用有限状态转换机来构成状态跳转结构,来确定是否存在唤醒识别语音。
可选地,基于用户所在的位置对用户语音进行响应包括:对驾驶员发出的语音的响应级别高于对乘员发出的语音的响应级别。
可选地,该方法还包括:对语音源发出的语音进行前端增强处理以去除回声消息和噪声信息。
本发明另外提供一种车内声源定位装置,包括:唤醒识别单元,识别语音源发出的语音以提取唤醒识别语音;时间差计算单元,与唤醒识别单元耦合,用于计算唤醒识别语音的波前分别到达不同麦克风阵列的第一时间差;以及位置判定单元,至少基于第一时间差和不同麦克风阵列的位置来确定用户所在的位置。
本发明提供的定位汽车内语音源的方法能够准确确定用户所在的车内位置,判明用户的意图,还可以据此进行智能响应,对驾驶员语音提供更高级别的智能响应,这有利于确保驾驶员不受干扰,从而提高了行车安全性。此外,车内声源定位装置同样能够实现上述效果。
附图说明
图1示出根据本发明第一实施例的定位汽车内语音源的方法的流程示意图。
图2示出波前到达麦克风阵列的声场示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蔚来汽车有限公司,未经蔚来汽车有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811525489.9/2.html,转载请声明来源钻瓜专利网。