[发明专利]一种基于毫米波雷达的声源定位方法、装置、设备以及存储介质有效
申请号: | 201910833334.X | 申请日: | 2019-09-04 |
公开(公告)号: | CN110673125B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 许荣雪;刘欢;刘晓龙;谭泽汉;陈彦宇;马雅奇 | 申请(专利权)人: | 珠海格力电器股份有限公司;珠海联云科技有限公司 |
主分类号: | G01S13/06 | 分类号: | G01S13/06;G01S7/41;G06K9/62 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 郭金鑫 |
地址: | 519070*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 毫米波 雷达 声源 定位 方法 装置 设备 以及 存储 介质 | ||
本申请涉及一种基于毫米波雷达的声源定位方法、装置、设备以及存储介质,本申请通过获取多个音频数据,所述音频数据是毫米波雷达检测到至少一个声源的音频信号后返回的;将多个所述音频数据输入预先建立的聚类模型,利用所述聚类模型对所述音频数据的声源位置进行聚类,得到至少一个声源坐标;根据至少一个所述声源坐标确定声源位置的方式,先使用毫米波雷达检测到多个音频数据,提升音频定位的精确度,再使用聚类模型将属于同一个声源产生的多个音频数据进行聚类,定位声源的位置,提升声源定位的精确度。
技术领域
本申请涉及声源定位技术领域,尤其涉及一种基于毫米波雷达的声源定位方法、装置、设备以及存储介质。
背景技术
传统的声源定位技术主要有三类:基于最大输出功率的可控波束形成的声源定位技术、基于高分辨率谱估计的声源定位算法以及基于声波到达时间差声源定位技术,传统的声源定位方法都可以实现对多声源位置的定位,但是无论上述何种传统的声源定位方法在实际对信号处理时,都要求音频信号是平稳的,但是音频信号是短时平稳信号,所以使用传统的声源定位方法会导致声源定位的结果出现偏差,定位的精确度差。
发明内容
为了解决传统的声源定位方法会导致声源定位的结果出现偏差,定位的精确度差的述技术问题,本申请提供了一种基于毫米波雷达的声源定位方法、装置、设备以及存储介质。
第一方面,本申请提供了一种基于毫米波雷达的声源定位方法,包括:
获取多个音频数据,所述音频数据是毫米波雷达检测到至少一个声源的音频信号后返回的;
将多个所述音频数据输入预先建立的聚类模型,利用所述聚类模型对所述音频数据的声源位置进行聚类,得到至少一个声源坐标;
根据至少一个所述声源坐标确定声源位置。
可选地,所述聚类模型的训练过程包括:
获取多个声源的训练样本,每个所述训练样本中包括:声源发出音频信号的音频数据及所述声源的实际位置坐标;
利用多个训练样本中声源的音频数据及实际位置坐标训练所述聚类模型,直至所述聚类模型收敛。
可选地,利用多个训练样本中声源的音频数据及实际位置坐标训练所述聚类模型,直至所述聚类模型收敛的步骤,包括:
分别将每一个训练样本中声源的音频数据输入所述聚类模型,得到训练位置坐标;
根据多个所述训练位置坐标和所述训练样本中的实际位置坐标之间的差异确定损失值;
利用多个所述损失值修正所述聚类模型,直至所述聚类模型收敛。
可选地,在所述聚类模型输出至少一个声源坐标时,根据至少一个所述声源坐标确定声源位置的步骤,包括:
将所述聚类模型输出的声源坐标确定为声源位置。
可选地,在所述聚类模型输出至少两个声源坐标时,根据至少一个所述声源坐标确定声源位置的步骤,包括:
利用离群点检测算法检测所述聚类模型输出的至少两个声源坐标中是否存在异常声源;
若存在异常声源,剔除所述异常声源;
将所述至少两个声源坐标中剩余的正常声源的正常声源坐标确定为声源位置。
可选地,所述方法还包括:
显示所述异常声源及所述正常声源;
获取用户对所述异常声源及所述正常声源进行标记的标记信息;
统计被正确判定为异常声源的声源第一数量、被误判为异常声源的声源的第二数量、被误判为正常声源的声源的第三数量及被正确判定为正常声源的第四数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司;珠海联云科技有限公司,未经珠海格力电器股份有限公司;珠海联云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910833334.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通信单元和用于时钟分布与同步的方法
- 下一篇:追踪测距系统及其方法