[发明专利]一种用于音频中筛选重复广告片段并生成毛音频的方法有效
申请号: | 201810180224.3 | 申请日: | 2018-03-05 |
公开(公告)号: | CN108513140B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 俞清木 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | H04N21/233 | 分类号: | H04N21/233;H04N21/439;G10L25/51 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 卢艳雪 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 音频 筛选 重复 广告 片段 生成 方法 | ||
1.一种用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的方法包含:
步骤1,音频采集存储;
步骤2,对所有音频进行点位和特征提取;
步骤3,对所有点位按特征进行聚类;
步骤4,以上述每一个聚类为一个节点生成有向图,称为商图;
步骤5,把商图中节点对应的前后相连的片段连缀成串;
步骤6,对上述图检测所有最大线性子图,也就是中间不带分叉的一串相连的节点;每个所述的子图对应一个无歧义重复音频片段,作为种子毛音频;
步骤7,对代表种子毛音频的子图进行剪枝;
步骤8,在全音频中对种子毛音频进行搜索,取得所有匹配的原始音频片段;
步骤9,取上述音频片段的中心片段;
步骤10,对中心片段按左右延长,直到无法与别的片段匹配;
步骤11,扩展后的中心片段为最终生成的一个毛音频。
2.如权利要求1所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的步骤3中的聚类,每一类包括的是重复音频在相同时间点提取的特征。
3.如权利要求1所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的步骤4中的商图的一个节点对应一个特征时间长度为2秒的重复音频片段。
4.如权利要求1所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的步骤5中向商图中添加有向边算法;所述的有向边算法为:如果节点A对应的聚类包含具体音频时间点a,节点B对应的聚类包含时间点b,并且b在a之后0.4秒之内则增加A到B的有向边;所述的有向边代表AB是同一重复音频前后相邻的两个特征。
5.如权利要求1所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的步骤6中的分叉代表在不同的重复片段前后播放的不同内容。
6.如权利要求1所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的步骤7中的剪枝为:如果从节点A到Z有两条平行的路径则删除较短的一条重复检测。
7.如权利要求1所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的步骤8中将所有匹配的原始音频片段的集合记为S,如果匹配数小于4则认为该音频重复次数少,予以丢弃。
8.如权利要求1所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的步骤10中的中心片段按左右延长的算法为:将原始音频片段的中心片段记为c,S中任意片段s与c都包含种子片段,从对应种子片段头部和尾部的时间点往前后匹配直至无法匹配,得到扩展时间t,S中除c以外的片段全都计算后得到|S|-1个t,取这些t中最典型值为最终扩展距离;在全音频中对种子毛音频进行搜索,取得所有匹配的原始音频片段的集合记为S。
9.如权利要求8所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的最典型值的算法为:确定区间[0,max(t)],对于每个t都对区间按以t为中心、σ为0.4秒的正态分布进行加权,最后取权重最高的位置。
10.如权利要求1~9中任意一项所述的用于音频中筛选重复广告片段并生成毛音频的方法,其特征在于,所述的方法还包含对毛音频分拣点位搜索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810180224.3/1.html,转载请声明来源钻瓜专利网。