[发明专利]一种多机器人协同的3D声源识别定位方法有效

申请号：	202011354622.6	申请日：	2020-11-27
公开（公告）号：	CN112379330B	公开（公告）日：	2023-03-10
发明（设计）人：	安康;付卫婷	申请（专利权）人：	浙江同善人工智能技术有限公司
主分类号：	G01S5/22	分类号：	G01S5/22
代理公司：	上海伯瑞杰知识产权代理有限公司 31227	代理人：	周兵
地址：	314100 浙江省嘉***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种机器人协同声源识别定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种多机器人协同的3D声源识别定位方法，其包括以下步骤：(S1)采集各机器人的麦克风的音频信号；(S2)将各音频信号与参考音频信号做互相关计算，若计算结果达到设定的阈值，则将其识别为待识别的音频信号；(S3)对于每个机器人，计算该机器人上任意两个麦克风的音频信号之间的互相关函数，然后对方向空间做离散化，在每个方向上计算对应时延下的互相关函数之和，找出最大响应值，最大响应值对应的方向即是声源相对该机器人的方向(S4)求解声源的坐标，并根据声源方向以及各机器人所在的位置对声源的坐标进行修正。本发明相较于通过到达时间差来计算空间声源的位置，提出了基于离散空间搜索最大相关性函数值的方法，其抵抗混响能力更强，搜索代价更小，运行速度快。

技术领域

本发明涉及移动机器人领域，特别涉及一种多机器人协同的3D声源识别定位方法。

背景技术

声源定位是听觉系统对发声物体位置的判断过程，它包括水平声源定位和垂直声源定位以及与听者距离的识别。对声源方位的识别是人和动物对环境感知的一种基本方法，有利于动物捕捉猎物、寻找配偶和躲避危险。在多声源的复杂声场中，声源定位功能更有助于从背景声中锁定声学目标，分离有用信息。

声源的识别与定位技术在机器人的目标定位领域有很重要的应用。借助听觉来辨别声源并判定发声的位置，使得机器人在感知环境时能获取更多的信息。一个典型的应用场景是，在RoboCup足球比赛中，机器人需要辨别裁判吹的哨声并定位该哨声以开始比赛。正确识别哨声便能抢占先机，能否正确的辨别哨声对比赛也起着非常重要的作用。

一般声源识别的方法主要采用提取信号频率主成分的方法，判断其是否在该类声音的频率范围内，但往往由于搭载在仿人机器人上的麦克风采样频率较低等原因，很容易受到高频噪声的干扰而产生误识别。另外，一般用来声源定位的方法使用GCC-PHAT算法，根据声源的到达时间差(TDOA)来建立空间几何关系，计算出声源的方向，但这种方法也很容易受到混响的干扰。

发明内容

本发明的目的是根据上述现有技术的不足，提供了一种多机器人协同的3D声源识别定位方法。

本发明目的实现由以下技术方案完成：

一种多机器人协同的3D声源识别定位方法，其特征在于包括以下步骤：

(S1)采集各机器人的麦克风的音频信号，并对其做快速傅里叶变换，得到各音频信号的频域信号；

(S2)将各音频信号与参考音频信号做互相关计算，若计算结果达到设定的阈值，则将其识别为待识别的音频信号，并跳转至步骤(S3)；否则跳转至步骤(S1)；

(S3)对于每个机器人，计算该机器人上任意两个麦克风的音频信号之间的互相关函数，然后对方向空间做离散化，在每个方向上计算对应时延下的互相关函数之和，找出最大响应值，最大响应值对应的方向即是声源相对该机器人的方向

(S4)求解声源的坐标，并根据声源方向以及各机器人所在的位置对声源的坐标进行修正。

本发明的进一步改进在于，在步骤(S1)中，采集音频信号的过程中，采样频率大于参考音频信号的频率的两倍。

本发明的进一步改进在于，在步骤(S2)中，当至少两个所述机器人采集到的音频信号的频域信号达到设定阈值时，将采集到的音频信号识别为待识别的音频信号。

本发明的进一步改进在于，在步骤(S2)中，将某个音频信号为x_i(n)与参考音频信号x_ref(n)做互相关计算包括以下步骤

(S21)计算参考音频信号x_ref(n)的自相关函数R_ref(τ)以及自相关函数R_ref(τ)的峰值，计算公式为：