[发明专利]一种声源定位方法及系统有效
申请号: | 201810995819.4 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109256153B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 关海欣;丁少为;马金龙 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G10L25/84 | 分类号: | G10L25/84;G01S5/18;G10L25/18;G10L15/22;G10L15/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声源 定位 方法 系统 | ||
本发明提供了一种声源定位方法及系统,其中,所述方法包括:从声源数据中识别语音段数据和噪音段数据;分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值;对相同相位处的所述语音评分值和所述噪音评分值进行处理,得到规整评分值,并基于所述规整评分值,确定所述声源对应的目标角度。本申请提供的技术方案,能够提高声源定位的精度。
技术领域
本发明涉及声音处理技术领域,特别涉及一种声源定位方法及系统。
背景技术
目前,为了对声源进行定位,通常是通过麦克风阵列接收的多通道语音数据计算声源方位。如可以在给定的角度范围内,计算归一化频谱与不同导向矢量间的内积,可以得到每个相位的打分输出,最终,可以将最大打分输出对应的相位位置作为声源的实际角度位置。
然而,在噪声干扰下,如果噪声分量高于语音分量就很容易造成计算方位错误。而这种情况在实际应用环境中非常容易出现,比如智能音箱放置于靠近马路的窗口位置,或者旁边挨着厨房的智能设备等等,都很容易出现定位错误。
发明内容
本申请的目的在于提供一种声源定位方法及系统,能够提高声源定位的精度。
为实现上述目的,本申请提供一种声源定位方法,所述方法包括:
从声源数据中识别语音段数据和噪音段数据;
分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值;
对相同相位处的所述语音评分值和所述噪音评分值进行处理,得到规整评分值,并基于所述规整评分值,确定所述声源对应的目标角度。
进一步地,从声源数据中识别语音段数据和噪音段数据包括:
对所述声源数据进行语音检测,得到所述声源数据中的语音起止点,并将所述语音起止点之间的数据作为所述语音段数据;
将所述语音段数据之前指定时长内的声源数据作为所述噪音段数据。
进一步地,在从声源数据中识别语音段数据和噪音段数据之后,所述方法还包括:
根据所述语音段数据和噪音段数据计算信噪比,若计算得到的所述信噪比小于预设信噪比阈值,才分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值。
进一步地,分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值包括:
分别确定所述语音段数据和所述噪音段数据各自的归一化频谱,并确定用于表征不同相位的导向矢量;
计算所述归一化频谱与所述导向矢量的内积,以确定所述归一化频谱在各个相位的评分值。
进一步地,对相同相位处的所述语音评分值和所述噪音评分值进行处理包括:
将相同相位处的语音评分值减去噪音评分值,得到对应相位处的规整评分值。
进一步地,基于所述规整评分值,确定所述声源对应的目标角度包括:
将最大规整评分值对应的相位确定为所述声源对应的目标角度。
为实现上述目的,本申请还提供一种声源定位系统,所述系统包括:
数据识别单元,用于从声源数据中识别语音段数据和噪音段数据;
评分值计算单元,用于分别计算所述语音段数据和所述噪音段数据在各个相位的语音评分值和噪音评分值;
目标角度确定单元,用于对相同相位处的所述语音评分值和所述噪音评分值进行处理,得到规整评分值,并基于所述规整评分值,确定所述声源对应的目标角度。
进一步地,所述数据识别单元包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810995819.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音评分方法及装置、电子设备、存储介质
- 下一篇:一种多媒体脑电波播放机