[发明专利]音频处理方法、装置、存储介质及计算机程序有效
申请号: | 202111194926.5 | 申请日: | 2021-10-14 |
公开(公告)号: | CN113643714B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 王子腾;纳跃跃;刘章;田彪;付强 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 存储 介质 计算机 程序 | ||
本发明公开了一种音频处理方法、装置、存储介质及计算机程序。其中,该方法包括:获取待测试音频的特征向量;将待测试音频的特征向量输入目标模型进行处理,得到目标时频掩蔽信息,其中,目标模型用于确定混响音频对应的时频掩蔽信息,时频掩蔽信息用于将混响音频处理为目标类型音频,目标类型音频中包含混响音频对应的声源的直达声和早期反射声;根据目标时频掩蔽信息处理待测试音频,得到目标音频。本发明解决了由于空间内的混响现象的存在,导致拾音设备采集到的音频的清晰度低的技术问题。
技术领域
本发明涉及音频处理技术领域,具体而言,涉及一种音频处理方法、装置、存储介质及计算机程序。
背景技术
混响是空间内的声源发音停止后声音继续存在的声学现象,混响的存在使得音频采集设备采集到的语言清晰度低,影响采集到的语音的可懂度。
其中,在较大的空间内,为了采集到空间各个区域发出的声音,需要采用两个或者多个拾音设备共同配合拾取空间内产生的音频,但是,由于空间较大,拾音设备采集的声音混响感非常明显,从而降低了采集到的音频内容的可懂度。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种音频处理方法、装置、存储介质及计算机程序,以至少解决由于空间内的混响现象的存在,导致拾音设备采集到的音频的清晰度低的技术问题。
根据本发明实施例的一个方面,提供了一种音频处理方法,包括:获取待测试音频的特征向量;将待测试音频的特征向量输入目标模型进行处理,得到目标时频掩蔽信息,其中,目标模型用于确定混响音频对应的时频掩蔽信息,时频掩蔽信息用于将混响音频处理为目标类型音频,目标类型音频中包含混响音频对应的声源的直达声和早期反射声;根据目标时频掩蔽信息处理待测试音频,得到目标音频。
根据本发明实施例的另一方面,还提供了另一种音频处理方法,包括:云服务器接收待测试音频;云服务器获取待测试音频的特征向量,采用目标模型对待测试音频的特征向量进行处理,得到目标时频掩蔽信息,并根据目标时频掩蔽信息处理待测试音频,得到目标音频,其中,目标模型用于确定混响音频对应的时频掩蔽信息,时频掩蔽信息用于将混响音频处理为目标类型音频,目标类型音频中包含混响音频对应的声源的直达声和早期反射声;云服务器返回目标音频至客户端。
根据本发明实施例的另一方面,还提供了另一种音频处理方法,包括:采集待测试音频,并在音频播放器播放待测试音频;在音频播放器播放待测试音频对应的目标音频,其中,目标音频是通过目标时频掩蔽信息对待测试音频进行处理后得到的音频,目标时频掩蔽信息是通过目标模型对待测试音频的特征向量进行处理得到的信息,目标模型用于确定混响音频对应的时频掩蔽信息。
根据本发明实施例的另一方面,还提供了另一种音频处理方法,包括:通过至少两个采集器采集教学空间内产生的音频,得到第一音频;获取第一音频的特征向量,并将第一音频的特征向量输入目标模型进行处理,得到目标时频掩蔽信息,其中,目标模型用于确定混响音频对应的时频掩蔽信息,时频掩蔽信息用于将混响音频处理为目标类型音频,目标类型音频中包含混响音频对应的声源的直达声和早期反射声;根据目标时频掩蔽信息处理第一音频,得到第二音频;将第二音频发送至教学空间所对应的远端课堂。
根据本发明实施例的另一方面,还提供了一种音频处理装置,包括:第一获取单元,用于获取待测试音频的特征向量;第一处理单元,用于将待测试音频的特征向量输入目标模型进行处理,得到目标时频掩蔽信息,其中,目标模型用于确定混响音频对应的时频掩蔽信息,时频掩蔽信息用于将混响音频处理为目标类型音频,目标类型音频中包含混响音频对应的声源的直达声和早期反射声;第二处理单元,用于根据目标时频掩蔽信息处理待测试音频,得到目标音频。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任意一种音频处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111194926.5/2.html,转载请声明来源钻瓜专利网。