[发明专利]基于音视频融合策略的敏感影片检测方法有效
申请号: | 200710304206.3 | 申请日: | 2007-12-26 |
公开(公告)号: | CN101470897A | 公开(公告)日: | 2009-07-01 |
发明(设计)人: | 胡卫明;左海强;吴偶 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周国城 |
地址: | 100080北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 融合 策略 敏感 影片 检测 方法 | ||
1.一种基于音视频融合策略的敏感视频检测方法,其特征在于,包括步骤:
通过敏感声音模型建立模块,建立敏感声音的混合高斯模型;
通过音视频分离模块,实现音视频数据的分离和加窗;
通过特征提取模块,实现音频特征提取;
通过分类融合模块,实现敏感声音片段的定位及敏感程度输出;
通过分类融合模块,实现敏感片断视频图像帧的检测,
通过分类融合模块,基于贝叶斯的音视频融合决策,将音频检测结果和视频检测结果相融合,对影片的敏感性做出综合决策;所述音视频融合决策的融合算法由基于贝叶斯规则确定:
F=[N1log(1-p2)+N2log(p2)+log(Lt)]
-[N1log(p1)+N2log(1-p1)+log(1-Lt+ε)],
式中,统计敏感视频图像帧识别算法的两类分类错误概率:把一幅正常图像误分为敏感图像的概率为p1,把一幅敏感图像误分为正常图像的概率为p2,假定被分割出的视频片断共有N幅关键帧,假定敏感图像检测算法对这N幅关键帧图像的识别结果为:N1幅关键帧图像是敏感的,N2幅关键帧图像是正常的;
Lt是音频片段的敏感程度;ε是一个足够小的正数;若因子F≥0,则影片被认为是敏感的;
所述的敏感声音片段的定位及其敏感程度输出包括:
计算声音片段与训练得到的混合高斯模型各高斯中心的马氏距离,并求其最小值dm;
按照如下公式,计算音频片段的敏感程度:
其中,θd是一个阈值,当dm<θd时,该声音片断被认为是敏感声音,否则为非敏感声音。
2.根据权利要求1所述的方法,其特征在于,所述的建立敏感声音的混合高斯模型包括:
收集敏感声音片段样本,建立敏感声音训练集和测试集;
对敏感声音训练集中的敏感声音片段提取13维梅尔频率倒谱参数(MFCC)特征,包括12维MFCC系数以及能量项,并以其均值向量作为该声音片段的特征;
采用期望最大算法得到混合高斯模型的各个参数,包括高斯个数、各个高斯的中心和协方差矩阵。
3.根据权利要求1所述的方法,其特征在于,所述的建立敏感声音的混合高斯模型步骤是独立的离线的过程,只需进行一次,得到的模型参数存储到数据文件中。
4.根据权利要求1所述的方法,其特征在于,所述敏感片断视频图像帧的检测是指,在与检测到敏感声音片断相同的时间轴区间上截取相应的视频图像帧集合,并对视频图像帧集合的敏感性进行检测。
5.根据权利要求1所述的方法,其特征在于,所述的基于贝叶斯的音视频融合决策过程是采用音频片段的敏感程度来作为与之相应的视频片断敏感与否的先验信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710304206.3/1.html,转载请声明来源钻瓜专利网。