[发明专利]一种音频处理方法、装置、设备及可读存储介质在审
申请号: | 202110114544.0 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112908302A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 徐东 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L13/02 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 常忠良 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 处理 方法 装置 设备 可读 存储 介质 | ||
1.一种音频处理方法,其特征在于,包括:
对输入干声进行换气声检测,确定所述输入干声中的换气声音频;
提取所述换气声音频的音频特征,并基于所述音频特征确定出目标换气声音频;
对所述输入干声中的所述目标换气声音频进行替换处理,得到输出干声;
将所述输出干声与背景音频进行合成处理,得到目标音频。
2.根据权利要求1所述的音频处理方法,其特征在于,所述对输入干声进行换气声检测,确定所述输入干声中的换气声音频,包括:
利用训练好的换气声检测网络,检测所述输入干声中的换气声;
将所述换气声对应的音频确定为换气声音频。
3.根据权利要求1所述的音频处理方法,其特征在于,所述音频特征为时长,所述基于所述音频特征确定出目标换气声音频,包括:
在所述时长位于预设时长区间的情况下,将所述换气声音频确定为所述目标换气声音频。
4.根据权利要求1所述的音频处理方法,其特征在于,所述音频特征为音质,所述基于所述音频特征确定出目标换气声音频,包括:
在所述音质低于音质阈值的情况下,将所述换气声音频确定为所述目标换气声音频。
5.根据权利要求1所述的音频处理方法,其特征在于,所述音频特征包括音质和时长,所述基于所述音频特征确定出目标换气声音频,包括:
若所述时长大于上限时长,则将所述换气声音频确定为所述目标换气声音频;
若所述时长小于下限时长,则在所述音质低于音质阈值的情况下,将所述换气声音频确定为所述目标换气声音频。
6.根据权利要求1所述的音频处理方法,其特征在于,在所述对输入干声进行换气声检测,确定所述输入干声中的换气声音频之后,还包括:
利用基频对所述换气声音频进行真伪检测;
根据真伪检测结果,剔除所述换气声音频中的伪换气声。
7.根据权利要求1至6任一项所述的音频处理方法,其特征在于,对所述输入干声中的所述目标换气声音频进行替换处理,得到输出干声,包括:
将所述输入干声中的所述目标换气声音频替换为标准换气声音频,得到所述输出干声。
8.根据权利要求7所述的音频处理方法,其特征在于,将所述输入干声中的所述目标换气声音频替换为标准换气声音频,得到所述输出干声,包括:
在所述目标换气声音频的时长小于所述标准换气声音频的情况下,将所述输入干声中的所述目标换气声音频替换为所述标准换气声音频,得到时长被延长的所述输出干声。
9.根据权利要求7所述的音频处理方法,其特征在于,将所述输入干声中的所述目标换气声音频替换为标准换气声音频,得到所述输出干声,包括:
在所述目标换气声音频的时长大于所述标准换气声音频的情况下,从所述目标换气声音频选取与所述标准换气声音频等时长音频替换为所述标准换气声音频,并对所述目标换气声音频中未替换部分进行静音处理,得到所述输出干声。
10.根据权利要求7所述的音频处理方法,其特征在于,将所述输入干声中的所述目标换气声音频替换为标准换气声音频,得到所述输出干声,包括:
获取所述输入干声的类别标签;
从标准换气声音频库中选出与所述类别标签匹配的目标标准换气声音频;
将所述输入干声中的所述目标换气声音频替换为所述目标标准换气声音频,得到所述输出干声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110114544.0/1.html,转载请声明来源钻瓜专利网。