[发明专利]声源定位方法、装置、计算机可读存储介质和电子设备在审
申请号: | 202011552864.6 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112799016A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 胡玉祥 | 申请(专利权)人: | 北京地平线信息技术有限公司 |
主分类号: | G01S5/20 | 分类号: | G01S5/20 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 秦卫中 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 定位 方法 装置 计算机 可读 存储 介质 电子设备 | ||
本公开实施例提供了一种声源定位方法、声源定位装置、计算机可读存储介质和电子设备。该声源定位方法包括:对传声器阵列所采集声源的原始混合音频信号进行语音分离,以获取多通道分离音频信号;从多通道分离音频信号中确定唤醒词所在的时间段;从原始混合音频信号中确定唤醒词所在的时间段对应的混合多通道音频信号;从多通道分离音频信号中确定唤醒词所在的单通道音频信号;基于混合多通道音频信号以及唤醒词所在的单通道音频信号,定位声源。本方案能够大大提高声源定位的准确性。
技术领域
本公开涉及声源定位领域,具体涉及一种声源定位方法、声源定位装置、计算机可读存储介质和电子设备。
背景技术
随着智能语音交互技术的不断发展,越来越多的智能交互设备应运而生。例如,智能电视、智能音箱、智能家居、智能机器人、车载智能交互设备等等。通过唤醒词唤醒智能交互设备,人们可以与智能交互设备进行语音交互,指示智能交互设备完成诸如音乐播放、天气播报等操作。
智能交互设备被唤醒后,可以根据麦克风拾取到的语音信号确定唤醒词的方位信息,并根据唤醒词方位对语音进行定向拾取,以减少噪声干扰。但是,当外界干扰声源的音量大于用户发出唤醒词的音量时,智能交互设备的定位结果通常为干扰声源的方位,大大地降低了声源定位的准确性,影响人机交互体验。
发明内容
有鉴于此,本公开的实施例提供了一种声源定位方法、声源定位装置、计算机可读存储介质和电子设备,能够大大地提高声源定位的准确性。
根据本公开实施例的第一方面,提供了一种声源定位方法,包括:对传声器阵列所采集声源的原始混合音频信号进行语音分离,以获取多通道分离音频信号;从多通道分离音频信号中确定唤醒词所在的时间段;从原始混合音频信号中确定唤醒词所在的时间段对应的混合多通道音频信号;从多通道分离音频信号中确定唤醒词所在的单通道音频信号;基于混合多通道音频信号以及唤醒词所在的单通道音频信号,定位声源。
根据本公开实施例的第二方面,提供了一种声源定位装置,包括:语音分离模块,用于对传声器阵列所采集声源的原始混合音频信号进行语音分离,以获取多通道分离音频信号;第一确定模块,用于从多通道分离音频信号中确定唤醒词所在的时间段;第二确定模块,用于从原始混合音频信号中确定唤醒词所在的时间段对应的混合多通道音频信号;第三确定模块,用于从多通道分离音频信号中确定唤醒词所在的单通道音频信号;定位模块,用于基于混合多通道音频信号以及唤醒词所在的单通道音频信号,定位声源。
根据本公开实施例的第三方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如上述任一所述的声源定位方法。
根据本公开实施例的第四方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于执行上述任一所述的声源定位方法。
本公开实施例提供的一种声源定位方法、声源定位装置、计算机可读存储介质和电子设备,通过确定唤醒词所在的时间段,结合与唤醒词所在的时间段对应的混合多通道音频信号进行声源定位,能够排除其他时间段的音频信号的干扰,同时可以提高后续处理的效率,减少处理量;另外,通过从语音分离后的多通道分离音频信号中确定唤醒词所在的单通道音频信号,得到仅仅包括或主要包括唤醒词的单通道信号,可以有针对性地对该唤醒词进行定位,从而提高声源定位的准确性。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1a所示为本公开一实施例所适用的智能家居场景示意图。
图1b所示为本公开一实施例所适用的车辆场景示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线信息技术有限公司,未经北京地平线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011552864.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维成像测试用光学系统
- 下一篇:聚苯胺基多元杂化膜及其制备方法和应用