[发明专利]音频广告检测方法、装置、电子设备及介质有效
申请号: | 201911359405.3 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111370022B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 陈剑超;肖龙源;李稀敏;蔡振华;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/24;G10L25/03 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 广告 检测 方法 装置 电子设备 介质 | ||
1.一种音频广告检测方法,其特征在于,包括:
接收待检测的第一音频信息及作为样例的第二音频信息,对第一音频信息进行分片处理,形成多个音频片段,每个音频片段具有起始时间和结束时间;
分别提取第一音频信息和第二音频信息的音频特征,所述音频特征包括粗检特征和精检特征;
对待检测音频信号和样例音频进行音频特征提取,包括一次性提取待检测音频信号和样例音频中每个音频帧的特征,包括粗检特征和精检特征,形成样例音频对应的模板矩阵和待检测音频信号对应的待检测特征矢量矩阵;
依次将第一音频信息中的音频片段和第二音频信息的粗检特征进行比对,筛选出符合预设粗检条件的音频片段;
建立第二音频信息的粗检特征直方图;依次建立第一音频信息中的音频片段粗检特征直方图,并计算与第二音频信息的粗检特征直方图的相似度;筛选出相似度大于预设相似度阈值的音频片段;
具体的,建立模板矩阵的粗检特征直方图,检测窗确定起始待匹配片段,锁定待匹配特征矩阵,并生成相应的粗检特征直方图,计算两个粗检特征直方图的相似度;
若相似度大于预设相似度阈值,则待匹配片段为候选片段,进入精检阶段;
若相似度小于预设相似度阈值,则自适应确定滑动步长,移动检测窗,进行下一片段的粗检过程;
依次将所述符合预设粗检条件的音频片段和第二音频信息的精检特征进行比对,筛选出符合预设精检条件的音频片段;
依次计算所述符合预设粗检条件的音频片段与第二音频信息的精检特征之间的欧氏距离;筛选出欧氏距离大于预设欧氏距离阈值的音频片段;
具体的,计算模板矩阵中精检特征与候选音频片段对应的候选矩阵中精检特征之间的欧氏距离;
若上述欧氏距离大于预设欧氏距离阈值,则可以设定滑动步长为1帧,移动检测窗,进行下一音频片段的粗检阶段;
若上述欧氏距离小于预设欧氏距离阈值,则可以认为当前待匹配音频片段与样例音频同源,即样例音频被检出;
输出所述符合预设精检条件的音频片段在第一音频信息中的起始时间和结束时间;
记录当前被检测出的音频片段在待检测音频信号中的起始时间和结束时间及标记的次序,输出此次检测结果;
若存在下一待匹配音频片段,则进行下一音频片段的粗检过程,若检测窗已经移动至待检测音频尾部,则检测结束。
2.根据权利要求1所述的方法,其特征在于,所述对第一音频信息进行分片处理之前,还包括:对第一音频信息进行预处理,预处理的方式包括格式标准化、预加重和加窗。
3.根据权利要求1或2所述的方法,其特征在于,所述粗检特征为过零率,所述精检特征为Mel频率倒谱系数MFCC。
4.一种音频广告检测装置,其特征在于,包括:
接收模块,用于接收待检测的第一音频信息及作为样例的第二音频信息,对第一音频信息进行分片处理,形成多个音频片段,每个音频片段具有起始时间和结束时间;
提取模块,用于分别提取第一音频信息和第二音频信息的音频特征,所述音频特征包括粗检特征和精检特征;对待检测音频信号和样例音频进行音频特征提取,包括一次性提取待检测音频信号和样例音频中每个音频帧的特征,包括粗检特征和精检特征,形成样例音频对应的模板矩阵和待检测音频信号对应的待检测特征矢量矩阵;
粗检模块,用于依次将第一音频信息中的音频片段和第二音频信息的粗检特征进行比对,筛选出符合预设粗检条件的音频片段;
精检模块,用于依次将所述符合预设粗检条件的音频片段和第二音频信息的精检特征进行比对,筛选出符合预设精检条件的音频片段;
输出模块,用于输出所述符合预设精检条件的音频片段在第一音频信息中的起始时间和结束时间;
所述粗检模块,具体用于:建立第二音频信息的粗检特征直方图;
依次建立第一音频信息中的音频片段粗检特征直方图,并计算与第二音频信息的粗检特征直方图的相似度;
筛选出相似度大于预设相似度阈值的音频片段;
所述精检模块,具体用于:依次计算所述符合预设粗检条件的音频片段与第二音频信息的精检特征之间的欧氏距离;
筛选出欧氏距离大于预设欧氏距离阈值的音频片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911359405.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种陶瓷介质滤波器
- 下一篇:产生错误隐藏信号的装置、方法和计算机可读介质