[发明专利]音频开头爆音的检测方法、装置及存储介质有效
申请号: | 201811089089.8 | 申请日: | 2018-09-18 |
公开(公告)号: | CN109346102B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 王征韬 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L25/78 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种音频开头爆音的检测方法、装置及存储介质,所述方法包括:获取训练样本,并对训练样本进行预处理,以获取多个不同尺度的音频子片段,然后将多个不同尺度的音频子片段输入第一参考模型中进行特征提取训练,以提取出多个不同尺度的特征图,再将多个不同尺度的特征图输入第二参考模型中进行特征融合训练,以得到特征融合参数,并根据多个不同尺度的特征图与特征融合参数生成检测模型,其中检测模型包括训练后的第一参考模型与第二参考模型,最后基于检测模型对待测音频进行音频开头爆音的检测,提升了音频开头爆音检测的准确率,能够有效检测音频的开头爆音。 | ||
搜索关键词: | 音频 开头 检测 方法 装置 存储 介质 | ||
【主权项】:
1.一种音频开头爆音的检测方法,其特征在于,所述方法包括:获取训练样本;对所述训练样本进行预处理,以获取多个不同尺度的音频子片段;将所述多个不同尺度的音频子片段输入第一参考模型中进行特征提取训练,以提取出多个不同尺度的特征图;将所述多个不同尺度的特征图输入第二参考模型中进行特征融合训练,以得到特征融合参数;根据所述多个不同尺度的特征图与特征融合参数生成检测模型,其中所述检测模型包括训练后的所述第一参考模型与第二参考模型;基于所述检测模型对待测音频进行音频开头爆音的检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811089089.8/,转载请声明来源钻瓜专利网。