[发明专利]声源定位方法和装置,及计算机存储介质在审
申请号: | 202011340094.9 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112466325A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 陈喆;胡宁宁;曹冰 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/51;G01S5/20 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘欣;张颖玲 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声源 定位 方法 装置 计算机 存储 介质 | ||
本申请实施例公开了一种声源定位方法和装置、及计算机存储介质,方法包括:通过第一声音采集模块和第二声音采集模块分别采集待定位声源对应的第一语音信号和第二语音信号;对第一语音信号和第二语音信号分别进行频域转换处理,获得第一频域信号和第二频域信号;若第一频域信号和第二频域信号包括语音信号,则将第一频域信号和第二频域信号确定为声源特征信号;根据预设定位模型、声源特征信号以及预设角度计算模型,确定待定位声源对应的目标方位角;其中,预设定位模型用于确定不同方位角对应的概率值。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种声源定位方法和装置,及计算机存储介质。
背景技术
随着智能语音的兴起,麦克风阵列拾音技术已逐步发展为语音识别处理过程中的热门技术。其中,基于麦克风阵列的声源定位方法被广泛应用于视频会议、语音增强、智能机器人、智能家居、车载通话设备等。例如,在视频会议系统中,声源定位可实现摄像头实时对准发言人;在应用于助听装置时,可为听力障碍者提供声源位置信息。
然而,为了更为准确的识别声源目标,保证定位精度,相关技术中声源定位方法在定位精度和计算量之间不能较好的均衡,往往计算量较大,计算复杂度较高,不适用于较小的电子设备。
发明内容
本申请实施例提供了一种声源定位方法和装置,及计算机存储介质,能够在保证定位精度的前提下,降低计算复杂度,进一步实现了定位精度和计算量之间的良好均衡。
本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供了一种声源定位方法,所述方法包括:
通过第一声音采集模块和第二声音采集模块分别采集待定位声源对应的第一语音信号和第二语音信号;
对所述第一语音信号和所述第二语音信号分别进行频域转换处理,获得第一频域信号和第二频域信号;
若所述第一频域信号和所述第二频域信号包括语音信号,则将所述第一频域信号和所述第二频域信号确定为声源特征信号;
根据预设定位模型、所述声源特征信号以及预设角度计算模型,确定所述待定位声源对应的目标方位角;其中,所述预设定位模型用于确定不同方位角对应的概率值。
第二方面,本申请实施例提供了一种声源定位装置,所述声源定位装置包括采集单元、转换单元以及确定单元,
所述采集单元,用于通过第一声音采集模块和第二声音采集模块分别采集待定位声源对应的第一语音信号和第二语音信号;
所述转换单元,用于对所述第一语音信号和所述第二语音信号分别进行频域转换处理,获得第一频域信号和第二频域信号;
所述确定单元,用于若所述第一频域信号和所述第二频域信号包括语音信号,则将所述第一频域信号和所述第二频域信号确定为声源特征信号;以及根据预设定位模型、所述声源特征信号以及预设角度计算模型,确定所述待定位声源对应的目标方位角;其中,所述预设定位模型用于确定不同方位角对应的概率值。
第三方面,本申请实施例提供了一种声源定位装置,所述声源定位装置包括处理器、存储有所述处理器可执行指令的存储器,当所述指令被所述处理器执行时,实现如上所述的声源定位方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时,实现如上所述的声源定位方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011340094.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据传输时钟控制电路、方法和处理器
- 下一篇:一种半导体器件及其制造方法