[发明专利]声源定位方法、电子设备及存储介质有效
申请号: | 201911158057.3 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110954866B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 董天旭 | 申请(专利权)人: | 达闼机器人有限公司 |
主分类号: | G01S5/18 | 分类号: | G01S5/18;G10L25/51 |
代理公司: | 北京智晨知识产权代理有限公司 11584 | 代理人: | 张婧 |
地址: | 200245 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 定位 方法 电子设备 存储 介质 | ||
本发明实施例涉及数据处理领域,公开了一种声源定位方法、电子设备及存储介质。本发明的部分实施例中,声源定位方法包括:获取各角度的指示参数,该角度的指示参数用于确定该角度对应的方向是否为声源方向;针对任一角度,根据该角度对应的参考区间内的指示参数,更新该角度的指示参数;其中,该角度对应的参考区间包括预定义的该角度的参考角度区间,和/或,预定义的该角度的参考时间区间,该角度对应的参考区间内的指示参数包括该角度的指示参数;根据各角度更新后的指示参数,确定声音的声源方向。该实施例提高了声源定位的鲁棒性,减小了偏差,能够减少坏值的出现。
技术领域
本发明实施例涉及数据处理领域,特别涉及声源定位方法、电子设备及存储介质。
背景技术
由于语音交互是自然友好的交互方式,它逐渐被人们所认可,并广泛应用于各个生活场景,如车载语音、智能电视与音响、智能机器人等。语音交互分为近场语音和远场语音。近场语音,如手机上的语音输入法等,已经非常成熟完善。真正改变人们交互方式的是远场语音。远场语音交互包括远场麦克风阵列拾音,语音识别和语音理解。因为远场语音与产品硬件如麦克风阵列形状、产品声学结构等紧密相关,远场语音是目前智能交互设备设计与制造的重要关注点。
然而,发明人发现现有技术中至少存在如下问题:目前的麦克风阵列拾音中的声源定位方法的鲁棒性差、偏差大且容易获得坏值。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施方式的目的在于提供一种声源定位方法、电子设备及存储介质,提高了声源定位的鲁棒性,减小了偏差,能够减少坏值的出现。
为解决上述技术问题,本发明的实施方式提供了一种声源定位方法,包括以下步骤:获取各角度的指示参数,该角度的指示参数用于确定该角度对应的方向是否为声源方向;针对任一角度,根据该角度对应的参考区间内的指示参数,更新该角度的指示参数;其中,该角度对应的参考区间包括预定义的该角度的参考角度区间,和/或,预定义的该角度的参考时间区间,该角度对应的参考区间内的指示参数包括该角度的指示参数;根据各角度更新后的指示参数,确定声音的声源方向。
本发明的实施方式提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上述实施方式提及的声源定位方法。
本发明的实施方式还提供了一种计算机可读存储介质,包括:存储有计算机程序,计算机程序被处理器执行时实现上述实施方式提及的声源定位方法。
本发明实施方式相对于现有技术而言,根据角度的参考时间区间和/或参考角度区间内的指示参数,进行声源定位,相对于只参考该角度的指示参数的方法,能够提高定位算法的鲁棒性,减小了实际方向和推算的声源方向之间的偏差,减少坏值的出现,为波束形成远场语音增强等模块提供有力技术保障。除此之外,由于本实施方式提及的声源定位方法,无需结合评分等其他算法,具有易于实现、高效运行的特点。
另外,参考区间包括参考角度区间;根据角度对应的参考区间内各角度的指示参数,更新角度的指示参数,具体包括:对角度对应的参考角度区间内的指示参数进行累加或加权累加计算,得到该角度更新后的指示参数。该实施例中,对参考角度区间的指示参数进行累计或者加权累计,能有效消除假的峰值,可以去除一些突兀的异常点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达闼机器人有限公司,未经达闼机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911158057.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电池片传送平台及其工艺
- 下一篇:一种建筑垃圾的处理方法