[发明专利]音频处理方法、装置、设备和存储介质有效
申请号: | 202010266252.4 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111477240B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 胡新辉 | 申请(专利权)人: | 浙江同花顺智能科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0272;G10L25/24;G10L15/04;G10L15/02 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 金爱静 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 设备 存储 介质 | ||
本申请涉及音频处理方法、装置、设备和存储介质。该方法包括:对待处理音频数据进行语音分离处理,得到至少两组音频分离结果;基于音频分离结果中各语音段的特征信息,确定出每组音频分离结果中语音段之间的第一距离特征值;基于确定出的音频分离结果中各语音段的音频重叠区域和非音频重叠区域的特征信息,确定出音频分离结果的语音段中音频重叠区域和非音频重叠区域之间的第二距离特征值;基于第一距离特征值和第二距离特征值,确定出音频分离结果的距离特征值;从至少两组音频分离结果的距离特征值中选取出目标距离特征值,并将目标距离特征值所对应的音频分离结果作为待处理音频数据的目标分离结果。如此,提高分离结果的精确度。
技术领域
本申请涉及音频处理技术,特别是涉及一种音频处理方法、装置、设备和存储介质。
背景技术
在嘈杂的声学环境中,通常会同时存在多个不同的声源,比如,多人的混叠的声音等。在这种声学环境下,人类的听觉系统能在一定程度上分辨出目标语音,而计算机在这方面的能力还远远不如人类。因此,如何在多个人声混杂的声学环境中分离出目标语音成为语音信号处理领域的重要研究方向。
虽然,现有技术提供了语音分离方案,但主要适用于语音和噪声的分离,由于语音和噪声的特性差别大,所以,现有语音降噪方案能够较好地完成降噪任务。而由于不同说话人的语音特性非常接近,语音分离的技术难度明显大于语音降噪。因此,如何将不同说话人的语音进行分离,仍是未解决的问题。
发明内容
为解决上述问题,本发明提出了一种音频处理方法、装置、设备和存储介质,能够将混叠的音频,比如不同音频来源混叠后的音频数据进行分离,并提高了分离结果的精确度,为智能化音频处理奠定了基础。
第一方面,本申请实施例提供音频处理方法,包括:
对待处理音频数据进行语音分离处理,得到至少两组音频分离结果;其中,待处理音频数据包含有不同音频来源混叠后的音频数据,每组音频分离结果中包含有至少两个语音段;
基于音频分离结果中各语音段的特征信息,确定出每组音频分离结果中语音段之间的第一距离特征值;
基于确定出的音频分离结果中各语音段的音频重叠区域和非音频重叠区域的特征信息,确定出音频分离结果的语音段中音频重叠区域和非音频重叠区域之间的第二距离特征值;
基于第一距离特征值和第二距离特征值,确定出音频分离结果的距离特征值;
从至少两组音频分离结果的距离特征值中选取出目标距离特征值,并将目标距离特征值所对应的音频分离结果作为待处理音频数据的目标分离结果。
本申请实施例中,所述基于音频分离结果中各语音段的特征信息,确定出每组音频分离结果中语音段之间的第一距离特征值,包括:
基于音频分离结果中各语音段的特征信息,确定出每组音频分离结果中语音段之间的第一特征值集合,其中,第一特征值集合包含以下特征值中的至少一种:音频距离特征值,内容距离特征值以及音频来源距离特征值;
对第一特征值集合所包含的特征值进行加权处理,得到每组音频分离结果中语音段之间的第一距离特征值。
本申请实施例中,所述基于确定出的音频分离结果中各语音段的音频重叠区域和非音频重叠区域的特征信息,确定出音频分离结果的语音段中音频重叠区域和非音频重叠区域之间的第二距离特征值,包括:
基于确定出的音频分离结果中各语音段的音频重叠区域和非音频重叠区域的特征信息,确定出音频分离结果的语音段中音频重叠区域和非音频重叠区域之间的第二特征值集合,其中,第二特征值集合包含以下特征值中的至少一种:音频距离特征值,内容距离特征值以及音频来源距离特征值;
对第二特征值集合所包含的特征值进行加权处理,得到音频分离结果的语音段中音频重叠区域和非音频重叠区域之间的第二距离特征值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江同花顺智能科技有限公司,未经浙江同花顺智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010266252.4/2.html,转载请声明来源钻瓜专利网。