[发明专利]音频相似度检测方法、装置、存储介质及计算机设备有效
申请号: | 201811233515.0 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109087669B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 陈均;赵旭峰;沈锦龙;樊征 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/18 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 相似 检测 方法 装置 存储 介质 计算机 设备 | ||
1.一种音频相似度检测方法,其特征在于,包括:
获取待检测音频;
从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列;
获取基准音频的基准特征序列;
获取所述待检测音频的特征序列,与所述基准音频的基准特征序列之间的相似距离,所述相似距离至少包括编辑距离、欧几里得距离和汉明距离;
构建所述编辑距离、欧几里得距离和汉明距离中各距离与子相似度之间的仿射函数;
根据各距离对应的仿射函数分别确定各距离对应的子相似度;
根据所述子相似度确定所述待检测音频和基准音频之间的相似度。
2.根据权利要求1所述的音频相似度检测方法,其特征在于,所述从所述待检测音频中筛选出满足预设条件的音频,并根据筛选出的音频获取所述待检测音频的特征序列,包括:
对所述待检测音频进行预处理,得到预处理后的音频;
获取所述预处理后的音频的能量谱;
根据所述能量谱,从所述预处理后的音频中筛选出满足预设条件的音频,并将筛选出的音频对应的频率序列设置为所述待检测音频的特征序列。
3.根据权利要求2所述的音频相似度检测方法,其特征在于,所述对所述待检测音频进行预处理,得到预处理后的音频,包括:
按照预设采样策略对所述待检测音频进行采样,得到采样后的音频;
按照预设分帧策略对所述采样后的音频进行分帧处理,得到分帧后的音频;
对所述分帧后的音频进行加窗处理,得到离散时域的预处理后的音频。
4.根据权利要求2所述的音频相似度检测方法,其特征在于,所述获取所述预处理后的音频的能量谱,包括:
对所述预处理后的音频进行积分变换,得到所述预处理后的音频对应的频谱;
根据所述频谱确定所述预处理后的音频的能量谱。
5.根据权利要求2所述的音频相似度检测方法,其特征在于,所述根据所述能量谱,从所述预处理后的音频中筛选出满足预设条件的音频,包括:
根据所述能量谱获取所述待检测音频的声音强度;
从所述待检测音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足所述预设条件的音频。
6.根据权利要求5所述的音频相似度检测方法,其特征在于,所述从所述待检测音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足所述预设条件的音频,包括:
将所述待检测音频的声音强度标准化到预设声音强度范围,得到声音强度标准化音频;
从所述声音强度标准化音频中筛选出声音强度大于预设阈值的音频,得到声音强度满足所述预设条件的音频。
7.根据权利要求1所述的音频相似度检测方法,其特征在于,当所述基准音频中包括目标基准音频和干扰音频时,所述获取基准音频的基准特征序列,包括:
获取所述目标基准音频的第一均方根能量均值,以及获取所述干扰音频的第二均方根能量均值;
获取所述目标基准音频的第一能量谱,以及获取所述干扰音频的第二能量谱;
根据所述第一能量谱、第一均方根能量均值、第二均方根能量均值及第二能量谱,对所述基准音频进行优化,得到优化后的基准音频;
获取所述优化后的基准音频的基准特征序列。
8.根据权利要求7所述的音频相似度检测方法,其特征在于,所述获取所述目标基准音频的第一均方根能量均值,以及获取所述干扰音频的第二均方根能量均值,包括:
确定所述目标基准音频的第一均方根能量,以及确定所述干扰音频的第二均方根能量;
获取所述目标基准音频的第一帧数和第一帧长,以及获取所述干扰音频的第二帧数和第二帧长;
根据所述第一均方根能量、第一帧数和第一帧长确定所述目标基准音频的第一均方根能量均值,以及根据所述第二均方根能量、第二帧数和第二帧长确定所述干扰音频的第二均方根能量均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811233515.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种步态识别的方法及装置
- 下一篇:情绪分析方法、系统、服务器及存储介质