[发明专利]一种视频中文字的检测与提取方法在审
申请号: | 201310689506.3 | 申请日: | 2013-12-12 |
公开(公告)号: | CN103699895A | 公开(公告)日: | 2014-04-02 |
发明(设计)人: | 褚晶辉;吕卫;董越 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 文字 检测 提取 方法 | ||
技术领域
本发明涉及一种视频检测。特别是涉及一种视频中文字的检测与提取方法。
背景技术
随着宽带网络、通信器材、存储设备以及数字电视等多媒体载体及处理设备的快速发展,视频下载和传输的安全问题越来越突出。如何有效地对视频的内容进行监控,确保视频的内容安全成为了研究的热点。通过检测视频中的文字信息是否含有特定的词语,可以实现对视频内容的有效监控。在对视频内容进行归档或检索时,也可把视频中的文字信息作为一种重要依据。在这些应用场合中,从视频中检测并提取在画面中嵌入的文字是关键的处理步骤。
文字检测的方法可分为以下三大类:基于边缘和梯度的方法、基于纹理的方法和基于连通域的方法。文字字符与背景会形成比较明显的边缘,可以利用此特点来检测文字区域,但是在复杂背景的情况下,应用边缘来检测文字会产生很多误判。基于连通域的方法是在文字字符具有相同的颜色或者灰度级这一假设上提出的,对文字检测有很大的局限性。基于纹理的方法利用图像中的文本有着与背景不同的纹理特性来决定一个像素点或图像块是否属于文本区域,该方法可以提取不同分辨率图像中不同尺寸、不同语言和不同字体的文本,具有一定的通用性,但是,它存在着计算量大和定位精度不高的缺点。
现今虽已提出很多文字检测的方法,但各种方法都有自身的优点和不足,加上复杂的背景和文字不同的颜色尺寸字体等问题使得文字检测仍然很具挑战性。
发明内容
本发明所要解决的技术问题是,提供一种有较好的检测率和缺失率的一种视频中文字的检测与提取方法。
本发明所采用的技术方案是:一种视频中文字的检测与提取方法,首先进行文字检测,然后进行文字提取,具体包括如下步骤:
1)启动算法,将彩色图像转换为灰度图像;
2)对灰度图像进行降采样处理,设定图像宽度的阈值为t1,当图像的宽度>t1时,作降采样处理,当图像的宽度t1≤时,不作任何处理,获取的图像设为I(x,y);
3)分别获取步骤2)中得到的图像I(x,y)的小波综合图像和角点特征图像;
4)结合角点特征图像和小波综合图像的统计特征来作为区分文字和非文字区域的特性,分别从角点特征图像和小波综合图像提取7个统计特征,产生14维的特征向量并归一化;
5)将特征向量放入k-means分类器中作分类,设定k=2,分类后将连通的文字块区域的外接矩形作为候选的文字区域;
6)对步骤3)中的角点特征图像进行二值化处理,再对处理后的二值化图像作形态学处理;
7)根据形态学处理后的二值图像的饱和度和方向两个特征作候选文字区域的筛选,对筛选后获得的文字区域做一次掩膜不超过N/2的膨胀;
8)进行文字提取,包括:
(1)根据步骤7)获取的文字位置信息,获取彩色文字条;
(2)在RGB彩色空间中对子通道图像分别运用大津法获得阈值作二值化处理,再合并三个二值图像,仅保留文字像素的交集,即候选文字像素区域;
(3)只将候选的文字像素区域的灰度值放入k-means分类器中做分类,区分标记后获取最终的文字像素区域。
步骤3)中所述的获取图像I(x,y)的小波综合图像,是对图像I(x,y)运用二维小波一级变换,分解结果为LL低频子带、LH水平方向高频子带、HL垂直方向高频子带和HH对角线方向高频子带,综合小波的三个高频子带得到小波综合图像S(x,y),小波综合图像S(x,y)的定义:
步骤3)中所述的获取图像I(x,y)的角点特征图像,是采用如下公式:
CR(x,y)=Ax2+2Cxy+By2
其中A=W*(Ix)2
B=W*(Iy)2
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310689506.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电动车或摩托车用的自动防盗中撑
- 下一篇:一种折叠式便携脱谷机