[发明专利]音频数据处理方法、系统及存储介质在审
申请号: | 202011229072.5 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112509595A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 谢芳 | 申请(专利权)人: | 广州小鹏汽车科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/04;G10L15/26;G10L15/22 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 邵泳城 |
地址: | 510640 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 数据处理 方法 系统 存储 介质 | ||
本申请公开了一种音频数据处理方法、系统以及存储介质。处理方法包括:播放音频文件并获取第一音频数据以形成播放声音信号,采集包括播放声音信号的环境声音信号以获得第二音频数据,确定第二音频数据中播放声音信号对应的数据相对第一音频数据的信号延迟时间,根据信号延迟时间缓存第一音频数据,以和第二音频数据进行同步,消除第二音频数据中播放声音信号对应的数据以获得目标音频数据。本申请的处理方法中,根据第二音频数据中播放声音信号对应的数据相对第一音频数据的信号延迟时间,对第一音频数据缓存以便与第二音频数据进行同步,如此,避免了因第一音频数据和第二音频数据不同步导致的回声消除效果差的问题,提升了回声消除效果。
技术领域
本申请涉及多媒体领域,特别涉及一种音频数据处理方法、系统及存储介质。
背景技术
在多媒体领域回声消除系统(Automatic Echo Cancellation,AEC)得到了广泛的应用。在一些具有上下行音频数据流的使用场景,比如说终端通话,语音识别,多麦克阵列智能音响等。这些场景的拾音系统往往由于音乐以及背景噪声的干扰,导致用户的语音很难被系统获取。回声消除系统原理是对上行信号以及下行参考信号做算法处理,并将上行信号中的回声部分进行消除,从而得到干净的上行信号。为获取到干净的上行信号,如何处理上下行信号同步的问题成为回声消除的关键。
发明内容
有鉴于此,本申请提供一种音频数据处理方法、系统及存储介质。
本申请的音频数据处理方法包括:
播放音频文件并获取第一音频数据,所述第一音频数据用于形成播放声音信号;
采集包括所述播放声音信号的环境声音信号以获得第二音频数据;
确定所述第二音频数据中与所述播放声音信号对应的数据相对所述第一音频数据的信号延迟时间;和
根据所述第一音频数据和所述信号延迟时间缓存所述第一音频数据以使所述第一音频数据和所述第二音频数据进行同步,消除所述第二音频数据中所述播放声音信号对应的数据以获得目标音频数据。
在某些实施方式中,所述第一音频数据包括预设脉冲音频数据。
在某些实施方式中,所述确定所述第二音频数据中与所述播放声音信号对应的数据相对所述第一音频数据的信号延迟时间包括:
根据所述预设脉冲音频数据的脉冲周期确定所述第二音频数据中所述预设脉冲音频数据对应的数据的波峰;和
根据所述预设脉冲音频数据的波峰与所述第二音频数据中与预设脉冲音频数据对应的数据的波峰确定所述信号延迟时间。
在某些实施方式中,所述预设脉冲音频数据包括第一采样率,所述第二音频数据包括第二采样率,所述根据所述预设脉冲音频数据的波峰与所述第二音频数据中与预设脉冲音频数据对应的数据的波峰确定所述信号延迟时间包括:
对所述预设脉冲音频数据和/或所述第二音频数据进行重采样处理以使所述第二采样率与所述第一采样率相同;
确定所述预设脉冲音频数据的波峰与相应的所述第二音频数据中与所述预设脉冲音频数据对应的数据的波峰之间的采样点个数;和
根据所述采样点个数和重采样处理后的采样率计算所述信号延迟时间。
在某些实施方式中,所述根据所述第一音频数据和所述信号延迟时间缓存所述第一音频数据以使所述第一音频数据和所述第二音频数据进行同步,消除所述第二音频数据中所述播放声音信号对应的数据以获得目标音频数据包括:
缓存所述第一音频数据;和
利用回声消除算法对缓存的所述第一音频数据与经过所述信号延迟时间后的所述第二音频数据进行处理以消除所述第二音频数据中所述播放声音信号对应的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州小鹏汽车科技有限公司,未经广州小鹏汽车科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011229072.5/2.html,转载请声明来源钻瓜专利网。