[发明专利]基于字幕信息的视频自动切分及标注方法及系统有效

专利信息
申请号: 201210262506.0 申请日: 2012-07-26
公开(公告)号: CN102833638A 公开(公告)日: 2012-12-19
发明(设计)人: 刘杰;李雷;赵志峰;张卫 申请(专利权)人: 北京数视宇通技术有限公司;华数传媒网络有限公司
主分类号: H04N21/83 分类号: H04N21/83
代理公司: 杭州裕阳专利事务所(普通合伙) 33221 代理人: 江助菊
地址: 100086 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 字幕 信息 视频 自动 切分 标注 方法 系统
【说明书】:

技术领域

发明涉及可以用于视频内容的碎片化处理、视频内容的编目、检索等技术领域,尤其涉及基于字幕信息的视频自动切分及标注方法及系统。

背景技术

网络时代最明显的特征就是传播的碎片化。在社区化时代到来的如今,由微博引领的信息碎片化传播已经逐步深入人心,“短小精悍”日益成为内容传播和分享的精髓。

在视频行业,以分享、编目及检索为目的的技术创新正在以同样的方式,将视频传播带入碎片化时代。视频中的文字信息无疑是实现这些需求的重要线索。

传统的视频切分是由人工完成的,需要耗费大量的人力与时间。基于字幕信息的视频自动切分及标注技术可将视频内容快速、准确、自动地切分,实现视频内容的碎片化。

发明内容

针对上述技术缺陷,本发明提出一种于字幕信息的视频自动切分及标注方法及系统。

为了解决上述技术问题,本发明的技术方案如下:

基于字幕信息的视频自动切分及标注方法,包括如下步骤:

11)分析视频格式,获得视频的帧率n;

12)每隔n帧利用文字定位技术确定视频帧中的文字区域,并将首次出现文字的视频帧的时间,定为该字幕的起始时间;

13)对于步骤12)的文字区域定位结果,每隔n帧计算相同位置的文字区域之间的相似度Se,如相似度Se大于一定阈值,则认为文字没有消失,返回执行步骤12);否则,认为文字消失,记录文字消失所在视频帧的时间点为当前字幕的消失时间,继续执行步骤14);

14)对于步骤12)的文字区域定位结果,利用文字识别技术进行文字识别,若视频处理完毕,执行步骤15);否则,返回执行步骤12);

15)根据字幕的起始时间和当前字幕的结束时间确定待切分视频的所有切分时间区间,基于切分时间区间,利用视频转码技术对视频进行切分,并利用字幕中的文字信息对视频进行标注。

进一步的,所述文字定位技术包括如下步骤:

21)视频帧图像设为f(x,y),利用Sobel算子处理f(x,y),得到边缘图像g(x,y);

22)利用最大类间方差法对所述边缘图像g(x,y)二值化,得到二值图像b1(x,y);

23)如果文字属于暗底亮字情况,计算二值图像b1(x,y)中值为1的像素的笔画强度特征,所述像素的笔画强度特征的计算公式为

DEw(x,y)=maxd=02{f(x,y)-mini=1w{h(x,y,i,d)}}]]>

其中,h(x,y,i,d)=max(f(x-i×dxd,y-i×dyd),f(x+(W+1-i)×dxd,y+(W+1-i)×dyd)}式中d=0,1,2,3,dx0=-1,dy0=0,dx1=-1,dy1=-1,dx2=0,dy2=-1,dx3=1,dy3=-1,表示笔画最常见的0,四个方向,W是笔画宽度的上限;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数视宇通技术有限公司;华数传媒网络有限公司,未经北京数视宇通技术有限公司;华数传媒网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210262506.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top