[发明专利]一种视频字幕提取的方法无效

申请号：	200710118595.0	申请日：	2007-07-10
公开（公告）号：	CN101115151A	公开（公告）日：	2008-01-30
发明（设计）人：	李鸿;彭宇新;肖建国	申请（专利权）人：	北京大学
主分类号：	H04N5/278	分类号：	H04N5/278;G06K9/32
代理公司：	北京君尚知识产权代理事务所	代理人：	余功勋
地址：	100871***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频字幕提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种视频字幕提取的方法，用于把视频字幕区域检测结果由灰度图转换成二值图，并利用OCR软件获取字幕的识别结果，其特征在于，包括以下步骤：

(1)对视频字幕区域进行基于连通区统计的字幕颜色判断，确认字幕颜色是深色还是浅色，同时反转浅色字幕的灰度图片为深色字幕图片；

(2)对步骤(1)获得的灰度图片进行基于局部窗口分析的灰度图片二值化；

(3)进行OCR软件识别，提取字幕结果。

2.如权利要求1所述的一种视频字幕提取的方法，其特征在于，所述步骤(1)之前增加字幕区域的灰度值调整步骤，按照下列公式调整字幕区域的每一个像素x的灰度值：

公式一：I’(x)＝128+(I(x)-med)×ratio

公式二：med＝(max-min)×0.5

公式三：ratio＝255/(max-min)

其中，I’(x)是经过调整后像素x的新灰度值，I(x)是调整之前像素x的灰度值，med是字幕区域内所有像素的最大灰度值max与最小灰度值min的平均值，ratio表示灰度值调整的幅度。

3.如权利要求1所述的一种视频字幕提取的方法，其特征在于，所述步骤(2)和(3)之间增加如下步骤：对所述步骤(2)获得的二值图片进行周边融合去噪，具体方法为：

(A)把二值图片周边一定像素宽的所有像素都变成黑色；

(B)寻找有周边像素的连通区，把这个连通区转成和背景相同的白色。

4.如权利要求1所述的一种视频字幕提取的方法，其特征在于，所述步骤(1)中颜色判断的具体方法是：用Otsu方法把灰度图片二值化，然后查找白色和黑色的4连通块，去除连通块外接矩形的宽高都极小的那些连通块，最后统计出白色连通块个数COM_white和黑色连通块个数COM_black，如果COM_white＞COM_black，则字幕是浅色的，反之则为深色。

5.如权利要求1所述的一种视频字幕提取的方法，其特征在于，所述步骤(2)的具体方法是：利用一个小窗口从左到右依次重叠扫描灰度字幕区域，然后对小窗口中的灰度值进行分析得到Otsu阈值，进行二值化。

6.如权利要求1所述的一种视频字幕提取的方法，其特征在于，所述步骤(3)中用OCR软件识别视频字幕区域的二值图片以获取视频字幕文本。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710118595.0/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N5-00 电视系统的零部件
H04N5-04 .同步
H04N5-14 .视频图像信号电路
H04N5-222 .电视演播室线路；电视演播室装置；电视演播室设备
H04N5-30 .转变光或模拟信息为电信号
H04N5-38 .发射机电路

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种视频字幕提取的方法无效

专利文献下载