[发明专利]一种识别音频流中重复片段方法及装置有效

专利信息
申请号: 201711101568.2 申请日: 2017-11-10
公开(公告)号: CN107844578B 公开(公告)日: 2021-08-13
发明(设计)人: 胡蓓蓓;虞逸斐;范晓安;谢家明 申请(专利权)人: 阿基米德(上海)传媒有限公司
主分类号: G06F16/683 分类号: G06F16/683
代理公司: 上海金盛协力知识产权代理有限公司 31242 代理人: 郑鸣捷
地址: 200051 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 识别 音频 重复 片段 方法 装置
【说明书】:

发明公开了一种识别音频流中重复片段方法。该方法包括:步骤一、生成待识别音频流的音频指纹,所述音频指纹的结构为(code,ts),code为音频特征码,ts是音频特征码对应的时间戳;步骤二、生成重复音频特征码时间字典,所述重复音频特征码时间字典记录了重复音频特征码及其对应于音频流中出现的不同时刻;步骤三、通过声纹特征码的时间差估计重复音频片段时间差;步骤四、根据估计的重复音频片段时间差,将产生该时间差的起始时刻和结束时刻记录时刻表中生成重复音频特征码时刻列表;步骤五、对重复音频特征码时刻列表,进行聚类,将聚集在一定时间范围的重复音频时刻分成了若干类;步骤六、处理每一类,获得重复音频片段时间。通过本发明提供的音频流中重复片段识别方法,克服了广播音频流进行内容分析和提取需要进行人工收听标注,降低了成本以及漏检率、提高了效率。

技术领域

本发明公开了一种识别音频流中重复片段的方法和装置,其所属技术领域为音频信号处理与识别领域,特别是互联网广音频的内容识别领域。

背景技术

音频指纹是从一段音频原始数据中提取的用来描述音频内容特征的一串数据。通过音频指纹的分析和比对可以完成音频内容的分析和检索,识别和检索音频片段。现有技术通过预先建立音频指纹数据库,然后将待识别的音频片段与音频指纹库中的数据进行比对。在达到预设的相似度后,判定为待识别音频与指纹库中的某条音频一致。在互联网广播领域,广播节目通过互联网进行直播或点播播放,广播音频内容具有重复性、碎片化等特点。对互联网广播音频流内容分析上,现有技术主要是通过人工处理整段音频流,对广播音频流中的内容进行标注及截取,最终呈现出广播音频流中有效的节目内容或者节目中的热点片段。

随着互联网广播的迅速发展,越来越多的广播音频流需要进行内容分析和提取。现有的人工收听标注方法存在以下缺点:

1、效率低,一段广播音频流的时长通常在一到三小时之间,人工收听并进行标记,需要花费较长的处理时间,无法适应互联网广播音频内容的爆炸式增长。

2、成本高,广播音频流中存在大量的重复内容,人工进行音频内容标注及编辑时(特别是在建立音频指纹库时)需要处理大量这些重复音频内容,为此将消耗大量的人力,随着人力成本增高,对广播音频流进行人工分析和标注带来了高成本的问题。

3、容易造成漏检,在目标音频识别上,采用人工进行分析容易造成目标音频的漏检。

综上所述,现有音频指纹检索对比技术以及广播音频流内容处理技术,已经无法适应互联网广播音频流的迅速增长,亦无法高效率低成本地完成互联网广播音频流的内容分析。

发明内容

为了解决利用现有技术对音频进行内容分析和提取带来的以上问题,本发明提供一种识别音频流中重复片段的方法,包括如下步骤:

步骤一、生成待识别音频流的音频指纹,所述音频指纹的结构为(code,ts),code为音频特征码,ts是音频特征码对应的时间戳;

步骤二、依据生成的音频特征码生成重复音频特征码时间字典,所述重复音频特征码时间字典记录了重复音频特征码及其对应于音频流中出现的不同时刻;

步骤三、根据重复音频特征码时间字典、通过一个或多个重复音频特征码各自出现的时间差估计重复音频片段时间差;

步骤四、根据估计的重复音频片段时间差、将产生该时间差的所有重复音频特征码出现的时刻按照从小到大的顺序记录在时刻表中生成重复音频特征码时刻排序表;

步骤五、对重复音频特征码时刻排序表进行聚类,将聚集在一定时间范围的重复音频时刻分成了若干类;

步骤六、处理每一类,获得重复音频片段时间。

与此对应、本发明还提供一种识别音频流中重复片段的装置,该装置包括以下功能模块:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿基米德(上海)传媒有限公司,未经阿基米德(上海)传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711101568.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top