[发明专利]基于字幕信息的视频自动切分及标注方法及系统有效
申请号: | 201210262506.0 | 申请日: | 2012-07-26 |
公开(公告)号: | CN102833638A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 刘杰;李雷;赵志峰;张卫 | 申请(专利权)人: | 北京数视宇通技术有限公司;华数传媒网络有限公司 |
主分类号: | H04N21/83 | 分类号: | H04N21/83 |
代理公司: | 杭州裕阳专利事务所(普通合伙) 33221 | 代理人: | 江助菊 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 字幕 信息 视频 自动 切分 标注 方法 系统 | ||
技术领域
本发明涉及可以用于视频内容的碎片化处理、视频内容的编目、检索等技术领域,尤其涉及基于字幕信息的视频自动切分及标注方法及系统。
背景技术
网络时代最明显的特征就是传播的碎片化。在社区化时代到来的如今,由微博引领的信息碎片化传播已经逐步深入人心,“短小精悍”日益成为内容传播和分享的精髓。
在视频行业,以分享、编目及检索为目的的技术创新正在以同样的方式,将视频传播带入碎片化时代。视频中的文字信息无疑是实现这些需求的重要线索。
传统的视频切分是由人工完成的,需要耗费大量的人力与时间。基于字幕信息的视频自动切分及标注技术可将视频内容快速、准确、自动地切分,实现视频内容的碎片化。
发明内容
针对上述技术缺陷,本发明提出一种于字幕信息的视频自动切分及标注方法及系统。
为了解决上述技术问题,本发明的技术方案如下:
基于字幕信息的视频自动切分及标注方法,包括如下步骤:
11)分析视频格式,获得视频的帧率n;
12)每隔n帧利用文字定位技术确定视频帧中的文字区域,并将首次出现文字的视频帧的时间,定为该字幕的起始时间;
13)对于步骤12)的文字区域定位结果,每隔n帧计算相同位置的文字区域之间的相似度Se,如相似度Se大于一定阈值,则认为文字没有消失,返回执行步骤12);否则,认为文字消失,记录文字消失所在视频帧的时间点为当前字幕的消失时间,继续执行步骤14);
14)对于步骤12)的文字区域定位结果,利用文字识别技术进行文字识别,若视频处理完毕,执行步骤15);否则,返回执行步骤12);
15)根据字幕的起始时间和当前字幕的结束时间确定待切分视频的所有切分时间区间,基于切分时间区间,利用视频转码技术对视频进行切分,并利用字幕中的文字信息对视频进行标注。
进一步的,所述文字定位技术包括如下步骤:
21)视频帧图像设为f(x,y),利用Sobel算子处理f(x,y),得到边缘图像g(x,y);
22)利用最大类间方差法对所述边缘图像g(x,y)二值化,得到二值图像b1(x,y);
23)如果文字属于暗底亮字情况,计算二值图像b1(x,y)中值为1的像素的笔画强度特征,所述像素的笔画强度特征的计算公式为
其中,h(x,y,i,d)=max(f(x-i×dxd,y-i×dyd),f(x+(W+1-i)×dxd,y+(W+1-i)×dyd)}式中d=0,1,2,3,dx0=-1,dy0=0,dx1=-1,dy1=-1,dx2=0,dy2=-1,dx3=1,dy3=-1,表示笔画最常见的0,四个方向,W是笔画宽度的上限;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数视宇通技术有限公司;华数传媒网络有限公司,未经北京数视宇通技术有限公司;华数传媒网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210262506.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置