[发明专利]一种滚动字幕检测方法及装置有效
申请号: | 201510145959.9 | 申请日: | 2015-03-30 |
公开(公告)号: | CN104735521B | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 许鹏;王涛;杨琛 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04N21/435 | 分类号: | H04N21/435;H04N21/81 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙)11413 | 代理人: | 马敬,项京 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 滚动 字幕 检测 方法 装置 | ||
技术领域
本发明涉及视频检测技术领域,特别涉及一种滚动字幕检测方法及装置。
背景技术
近年来,电视节目及视频的播放画面中经常会出现滚动字幕,以文本的方式为观众提供附加信息,然而在有些情况下,这些字幕可能会起到负面作用,例如,以字幕形式出现的的实时信息(包括股价、新闻动态等),这些信息由于具有实效性,因此仅在直播的情况下才是有意义的,当用户观看重播视频时,这些实时信息可能反而会误导观众。
针对上述情况,需要对视频中滚动字幕进行检测,以便进行删除或替换等处理。现有的一种自动检测滚动字幕的方式是基于光流的目标跟踪技术实现的。然而由于基于光流的目标跟踪技术主要使用松弛迭代算法,该算法比较费时,因此,检测速度较慢。
发明内容
为了解决上述问题,本发明实施例公开了一种滚动字幕检测方法及装置,具体技术方案如下:
本发明提供的一种滚动字幕检测方法,所述方法包括:
获取目标视频段,所述目标视频段包含N个视频帧;
针对所述目标视频段中的每一视频帧图像i,对该图像进行边缘检测,确定该图像中的边缘像素点;统计该图像中每一行的边缘像素点占比,根据统计结果,确定该视频帧图像i的候选字幕区域集Pi;所述Pi中的区域满足以下条件:该区域的上下边缘所在行的边缘像素点占比均不小于预设的第一占比阈值、且该区域的高度不大于预设的高度阈值,其中,i的取值为从1到N的自然数;
根据所确定的每个Pi,进一步确定所述目标视频段的候选字幕区域集V,所述V中的区域满足以下条件:包含候选字幕区域集V中的区域的视频帧图像的数量占比不小于预设的第二占比阈值、且候选字幕区域集V中的区域在包含候选字幕区域集V中的区域的视频帧图像中的每一视频帧图像中处于相同位置;
针对V中的每一个区域V[j],确定包含候选字幕区域集V中的区域的帧图像序列,判断该序列中的任意两个相邻帧图像是否均满足:后一帧图像中与V[j]对应的图像部分相对前一帧图像中与V[j]对应的图像部分存在像素平移,如果是,则将V[j]确定为所述目标视频段的滚动字幕区域。
根据本发明提供的一种具体实施方式,所述统计该图像中每一行的边缘像素点占比,包括:
对该图像中的边缘像素点进行水平方向投影,得到对应该图像的水平投影结果;根据水平投影结果,统计该图像中每一行的边缘像素点占比。
根据本发明提供的一种具体实施方式,所述判断该序列中的任意两个相邻帧图像是否均满足:后一帧图像中与V[j]对应的图像部分相对前一帧图像中与V[j]对应的图像部分存在像素平移,包括:
针对该序列中的每一个视频帧图像,对该图像中的边缘像素点进行垂直方向投影,得到对应该图像的垂直投影结果;根据垂直投影结果,统计该图像中每一列的边缘像素点数目,生成对应该图像的w维向量;
对该序列中每一对相邻视频帧图像所对应的w维向量进行范围在[1,P]个像素的滑动比较计算,获得比较结果;
根据获得的比较结果,判断该序列中的任意两个相邻帧图像是否均满足:后一帧图像中与V[j]对应的图像部分相对前一帧图像中与V[j]对应的图像部分存在像素平移;
其中,w为该图像的图像宽度,所述w维向量中,每一个元素的取值分别对应该图像中每一列边缘像素点的数目。
根据本发明提供的一种具体实施方式,所述对该序列中每一对相邻视频帧图像所对应的w维向量进行范围在[1,P]个像素的滑动比较计算,获得比较结果,包括:
对该序列中每一对相邻视频帧图像所对应的w维向量代入如下公式进行计算:并将diffp与DiffThresh进行比较,得到比较结果;
若diffp小于则比较结果为:后一帧图像中与V[j]对应的图像部分相对前一帧图像中与V[j]对应的图像部分存在像素平移;其中,p的取值为从1到P的自然数;
其中,w为该图像的图像宽度,所述w维向量中,每一个元素的取值分别对应该图像中每一列边缘像素点的数目;i为所述视频帧图像的编号,取值为从1到N的自然数;N为目标视频段包含的视频帧数。
根据本发明提供的一种具体实施方式,在确定出滚动字幕区域之后,还包括:
将滚动字幕区域中图像替换为预设图像。
一种滚动字幕检测装置,所述装置包括:
视频段获取模块,用于获取目标视频段,所述目标视频段包含N个视频帧;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510145959.9/2.html,转载请声明来源钻瓜专利网。