[发明专利]从音视频中检测广告的方法及系统有效
申请号: | 200910087428.3 | 申请日: | 2009-06-22 |
公开(公告)号: | CN101576955A | 公开(公告)日: | 2009-11-11 |
发明(设计)人: | 李新辉;王向东;高扬;钱跃良;林守勋 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;H04N7/52;H04H60/63 |
代理公司: | 北京律诚同业知识产权代理有限公司 | 代理人: | 祁建国;梁 挥 |
地址: | 100080北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 检测 广告 方法 系统 | ||
1.一种从音视频中检测广告的方法,其特征在于,所述方法包括:
步骤1,从待检测的音视频中提取音频,从音频中提取帧的短时能量和美尔倒谱系数特征;
步骤2,根据帧的短时能量和美尔倒谱系数特征从所述音频中查找出相互间相似度满足预设条件的两组帧,每组内部中的帧在所述音频中位置连续,每组帧在待检测的音视频中对应的音视频片段为广告;
所述步骤2进一步为:
步骤21,根据帧的短时能量将所述音频划分为能量包络单元;
步骤22,根据帧的短时能量和能量包络单元的长度从所述能量包络单元中查找出相互间能量包络形状相似度满足预设形状相似度条件的两组位置连续能量包络单元,每组能量包络单元组成能量包络序列;
步骤23,根据能量包络序列中帧的美尔倒谱系数特征判断所述能量包络序列间的语义相似度是否满足预设的语义相似度条件,如果满足,则所述能量包络序列在待检测的音视频中对应的音视频片段为广告。
2.如权利要求1所述的从音视频中检测广告的方法,其特征在于,
在所述能量包络序列间的语义相似度满足预设的语义相似度条件时,所述步骤23后还包括:
步骤31,对于满足语义相似度条件的两组能量包络序列各自开始帧之前的帧,依次判断对应帧之间的语义相似度是否满足所述语义相似度条件,第一个不满足所述语义相似度条件的帧在音频中的下一个帧为广告的起始位置。
3.如权利要求2所述的从音视频中检测广告的方法,其特征在于,
在所述能量包络序列间的语义相似度满足预设的语义相似度条件时,所述步骤23后还包括:
步骤41,对于满足语义相似度条件的两组能量包络序列各自结束帧之后的帧,依次判断对应帧之间的语义相似度是否满足所述语义相似度条件,第一个不满足所述语义相似度条件的帧在音频中前一个帧为广告的结束位置。
4.如权利要求2所述的从音视频中检测广告的方法,其特征在于,所述步骤1还包括,
步骤51,对帧的短时能量进行平滑处理,以平滑处理后的短时能量作为帧的短时能量。
5.如权利要求4所述的从音视频中检测广告的方法,其特征在于,所述步骤21进一步为,
步骤61,根据帧的短时能量,将位于能量曲线上升沿并且能量上升幅度超过预设的幅度值的帧作为能量包络单元的划分点;
步骤62,从所述划分点将音频划分为能量包络单元。
6.如权利要求4所述的从音视频中检测广告的方法,其特征在于,所述步骤22进一步为,
步骤71,从所述能量包络单元中查找出满足长度相似度条件的两组位置连续的能量包络单元,每组能量包络单元组成候选能量包络序列,所述长度相似度条件为每组间相同位置的能量包络单元的长度的差值小于预设长度差值;
步骤72,依据所述候选能量包络序列中帧的短时能量判断候选能量包络序列间的能量突变相关度是否大于预设的能量突变相关度阀值,如果是,则所述候选能量包络序列为所述能量包络序列。
7.如权利要求4所述的从音视频中检测广告的方法,其特征在于,所述步骤23进一步为,
步骤81,计算所述能量包络序列间的每对对应帧间的美尔倒谱系数的欧式距离;
步骤82,判断欧式距离小于预设距离阀值的帧的个数是否大于预设的数量阀值,如果是,则所述能量包络序列对应的音视频片段为广告。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910087428.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铁道货车侧架承台至弹簧承台距离测量尺
- 下一篇:新型机翼形管