[发明专利]音频检测方法及装置有效
申请号: | 201610201533.5 | 申请日: | 2016-03-31 |
公开(公告)号: | CN107293307B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 张荣 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L25/54 | 分类号: | G10L25/54 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 宋子良 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 检测 方法 装置 | ||
本申请公开了一种音频检测方法及装置。其中,该方法包括:获取待测音频文件的音频指纹;对于所述待测音频文件的每个音频指纹,从与所述音频指纹对应的倒排列表中查找所述待测音频文件的相似音频文件;其中,所述倒排列表中的每条记录包括:样本音频文件标识,以及样本指纹在样本音频文件中出现的位置,所述样本音频文件为所述样本音频文件标识所指示的音频文件;获取所述待测音频文件与所述相似音频文件的相似度,并根据所述相似度确定所述待测音频文件是否为指定类型的音频。
技术领域
本发明涉及音频检测领域,具体而言,涉及一种音频检测方法及装置。
背景技术
目前,针对违规音频的检测,一般采用MD5值比对和音频数字水印等音频检索算法,其中,
MD5值比对:任何音频文件的MD5值都是一个文本串,长度为32。相同音频文件的MD5值必然相同;即使两个文件只有一个比特的差异,MD5值也不相同。也就是说,哪怕是同一首歌曲,其不同采样率下的文件MD5值也不同。我们可以把两个音频文件是否相同的判断问题变为比较两者MD5值是否一致的问题。MD5值比对法的优点是计算简单、正确率100%,但是漏检率很高,只能检出与索引中完全一样的音频文件。
音频数字水印:在数字水印技术中有一种用于盗版源头跟踪的经过特殊设计的水印信息,对音频文件的每个拷贝嵌入不同的水印,在发现盗版时即可据此发现盗版分发的源头,其主要理论基础是通信理论中各种具有正交性的码字设计。然而,针对特定业务场景,违规音频往往并不会嵌入水印来帮助监管方追查其来源。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
根据本申请实施例的一个方面,提供了一种音频检测方法,包括:获取所述待测音频文件的音频指纹;对于所述待测音频文件的每个音频指纹,从与所述音频指纹对应的倒排列表中查找所述待测音频文件的相似音频文件;其中,所述倒排列表中的每条记录包括:样本音频文件标识,以及样本指纹在样本音频文件中出现的位置,所述样本音频文件为所述样本音频文件标识所指示的音频文件;获取所述待测音频文件与所述相似音频文件的相似度,并根据所述相似度确定所述待测音频文件是否为指定类型的音频。
可选地,对于所述待测音频文件的每个音频指纹,从与所述待测音频文件的音频指纹对应的所述倒排列表中查找所述待测音频文件的音频指纹出现的时间集合,其中,所述时间集合的组成元素为:所述待测音频文件的音频指纹在所有所述样本音频文件中出现的位置所指示的时间;
对于所述待测音频文件的每个音频指纹,将所述待测音频文件的音频指纹在所述待测音频文件中出现的时间作为基准时间,与所述时间集合中的元素进行取差运算,并依据得到的时间差生成中间结果;其中,所述中间结果由所述样本音频文件标识,以及与所述样本音频文件标识对应的所述时间差组成;
对于所述倒排列表中的每个样本音频文件标识,依据所述中间结果统计与所述样本音频文件标识所指示的样本音频文件中所有相同时间差的个数,并按照所述个数从多至少的顺序对所述倒排列表中的样本音频文件进行排序,得到前M个样本音频文件,并将所述前M个样本音频文件作为所述相似音频文件,其中,M为自然数。
可选地,获取所述待测音频文件与所述相似音频文件的相似度,包括:依据所述待测音频文件中的指纹数N1与所述M个音频文件中的每个音频文件的指纹数N2,以及特征点对的个数N,获取所述待测音频文件与所述M个音频文件中的每个音频文件的相似度,其中,N1、N2和N均为自然数;其中,所述特征点对通过以下方式获取:所述M个音频文件中每个音频文件的每一帧在频谱图上的局部极大值所对应的锚点与预设矩阵目标区域中的锚点进行两两组合,将每个组合作为一个所述特征点对;其中,所述锚点为每一帧频谱图中的局部极大值所对应的采样点。
可选地,所述音频文件的每一帧所对应采样点的取值通过以下方式确定:[2048k,2048k+4095],其中,k为自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610201533.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别处理方法及装置
- 下一篇:托盘刹车装置