[发明专利]一种视频中文字的检测与提取方法在审

专利信息
申请号: 201310689506.3 申请日: 2013-12-12
公开(公告)号: CN103699895A 公开(公告)日: 2014-04-02
发明(设计)人: 褚晶辉;吕卫;董越 申请(专利权)人: 天津大学
主分类号: G06K9/20 分类号: G06K9/20;G06K9/46
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 杜文茹
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 视频 文字 检测 提取 方法
【权利要求书】:

1.一种视频中文字的检测与提取方法,其特征在于,首先进行文字检测,然后进行文字提取,具体包括如下步骤:

1)启动算法,将彩色图像转换为灰度图像;

2)对灰度图像进行降采样处理,设定图像宽度的阈值为t1,当图像的宽度>t1时,作降采样处理,当图像的宽度t1≤时,不作任何处理,获取的图像设为I(x,y);

3)分别获取步骤2)中得到的图像I(x,y)的小波综合图像和角点特征图像;

4)结合角点特征图像和小波综合图像的统计特征来作为区分文字和非文字区域的特性,分别从角点特征图像和小波综合图像提取7个统计特征,产生14维的特征向量并归一化;

5)将特征向量放入k-means分类器中作分类,设定k=2,分类后将连通的文字块区域的外接矩形作为候选的文字区域;

6)对步骤3)中的角点特征图像进行二值化处理,再对处理后的二值化图像作形态学处理;

7)根据形态学处理后的二值图像的饱和度和方向两个特征作候选文字区域的筛选,对筛选后获得的文字区域做一次掩膜不超过N/2的膨胀;

8)进行文字提取,包括:

(1)根据步骤7)获取的文字位置信息,获取彩色文字条;

(2)在RGB彩色空间中对子通道图像分别运用大津法获得阈值作二值化处理,再合并三个二值图像,仅保留文字像素的交集,即候选文字像素区域;

(3)只将候选的文字像素区域的灰度值放入k-means分类器中做分类,区分标记后获取最终的文字像素区域。

2.根据权利要求1所述的一种视频中文字的检测与提取方法,其特征在于,步骤3)中所述的获取图像I(x,y)的小波综合图像,是对图像I(x,y)运用二维小波一级变换,分解结果为LL低频子带、LH水平方向高频子带、HL垂直方向高频子带和HH对角线方向高频子带,综合小波的三个高频子带得到小波综合图像S(x,y),小波综合图像S(x,y)的定义:

S(x,y)=LH2+HL2+HH2.]]>

3.根据权利要求1所述的一种视频中文字的检测与提取方法,其特征在于,步骤3)中所述的获取图像I(x,y)的角点特征图像,是采用如下公式:

CR(x,y)=Ax2+2Cxy+By2

其中A=W*(Ix)2

B=W*(Iy)2

C=W*Ix*Iy

W(u,v)=exp-(u2+v2)/2

Ix,Iy分别为I(x,y)在x和y方向的边缘幅值,W(u,v)为光滑作用的高斯模板。

4.根据权利要求1所述的一种视频中文字的检测与提取方法,其特征在于,步骤4)中所述的提取7个统计特征是,分别将步骤3)中的图像S(x,y)和CR(x,y)分割为N×N大小的块G(i,j),其中N=10,高和宽都扩展至N的倍数,扩展区域填充为0,分类后只保留扩展前的部分,对每个N×N大小的块提取7个统计特征,统计特征分别为能量、熵、惯量、局部同态性、均值、二阶中心距和三阶中心距,共7个,具体公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310689506.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top