[发明专利]声源定位方法、装置、智能设备及存储介质有效
申请号: | 201811589789.3 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109709518B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 郑垦 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G01S5/20 | 分类号: | G01S5/20 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 定位 方法 装置 智能 设备 存储 介质 | ||
本发明涉及语音信号处理技术领域,公开了一种声源定位方法、装置、智能设备及存储介质,所述方法包括:根据从语音采集装置获取的脉码编码调制PCM数据确定是否触发定位操作,每一帧PCM数据携带有帧号;从触发定位操作的PCM数据中提取帧号;将帧号发送给语音采集装置,以使语音采集装置根据帧号对应的PCM数据计算声源方位。本发明实施例提供的技术方案,提高了声源定位的准确性,从而实现远场拾音,提高语音识别的质量,提升用户体验。
技术领域
本发明涉及语音信号处理技术领域,尤其涉及一种声源定位方法、装置、智能设备及存储介质。
背景技术
目前,市场上有越来越多的产品具有语音交互功能,例如智能音箱、机器人等智能设备。这些智能设备在接收到唤醒指令时,会从睡眠状态转为工作状态,并开始通过语音采集装置采集语音信号,进而可以对该语音信号进行识别和解析,从而响应该语音信号对应的交互指令。显然,在产品功能实现过程中,声源定位是非常重要的,只有准确地定位用户声源方位,才能准确地获取用户发出的语音信号,才能进行正确的响应行为。
上述具有语音交互功能的智能设备在接收到唤醒指令后,由智能设备内的控制装置中安装的软件系统的SDK层将唤醒消息通过local socket的方式发送给语音采集装置。由于消息的传递具有时延性,因此,语音采集装置在收到唤醒消息后,会往后回溯固定的时间以找到唤醒时刻用户的语音信息,并基于唤醒时刻用户的语音信息计算用户的方位,并将方位信息通过local socket的方式反馈给SDK层。
由于唤醒功能一般在智能设备中实现,而智能设备受限于成本等原因,硬件规格往往不高。当智能设备的CPU或内存的利用率较高时,会导致local socket消息严重滞后,而此时语音采集装置仍通过回溯固定的时间查找语音信息,会导致查找到的语音信息并不是唤醒时刻的语音信息,影响声源定位的准确率。
发明内容
本发明实施例提供一种声源定位方法、装置、智能设备及存储介质,以解决现有技术中无法准确确定唤醒时刻,导致声源定位准确率低的问题。
第一方面,本发明一实施例提供了一种声源定位方法,包括:
根据从语音采集装置获取的脉码编码调制PCM数据确定是否触发定位操作,每一帧PCM数据携带有帧号;
从触发定位操作的PCM数据中提取帧号;
将帧号发送给语音采集装置,以使语音采集装置根据帧号对应的PCM数据计算声源方位。
第二方面,本发明一实施例提供了一种声源定位方法,包括:
为每一帧脉码编码调制PCM数据添加帧号并发送给智能设备的控制装置;
接收控制装置发送的帧号;
查找到帧号对应的PCM数据,并基于查找到的PCM数据计算声源方位。
第三方面,本发明一实施例提供了一种声源定位装置,包括:
识别模块,用于根据从语音采集装置获取的脉码编码调制PCM数据确定是否触发定位操作,每一帧PCM数据携带有帧号;
提取模块,用于从触发定位操作的PCM数据中提取帧号;
发送模块,用于将帧号发送给语音采集装置,以使语音采集装置根据帧号对应的PCM数据计算声源方位。
第四方面,本发明一实施例提供了一种声源定位装置,包括:
帧号添加模块,用于为每一帧脉码编码调制PCM数据添加帧号并发送给智能设备的控制装置;
接收模块,用于接收控制装置发送的帧号;
定位模块,用于查找到帧号对应的PCM数据,并基于查找到的PCM数据计算声源方位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811589789.3/2.html,转载请声明来源钻瓜专利网。