[发明专利]一种图像识别中倾斜文字判断方法有效
申请号: | 201510608915.5 | 申请日: | 2015-09-22 |
公开(公告)号: | CN105590112B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 陈炳章;何宏靖;刘世林;吴雨浓 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 倾斜 文字 判断 方法 | ||
本发明涉及图像识别领域,特别涉及一种图像识别中倾斜文字判断方法;在图像文字识别中,通过选择一个行向量,把该行向量与文字笔画相交的左右两侧交点的坐标点提取出来;以左右两侧的交点为起点分别向左上和右上两个方向追踪对应笔画的边缘点,并将追踪结果分别存于Vector1,Vector2中;通过对比两个类元素数量的大小确定文字的倾斜方向,并将较大类中最小的倾斜角度作为文字的倾斜角度。通过本发明方法实现倾斜角度判断的计算量小,判断结果准确度高,实时性好。此外本发明在判断出文字倾斜方向和角度的基础上,通过仿射变换将图像中倾斜的文字矫正,解决了文字切分难题,在图像文字识别领域有广阔的应用前景。
技术领域
本发明涉及图像识别领域,特别涉及一种图像识别中倾斜文字判断方法。
背景技术
随着社会的发展和科技的进度,种类繁多的视听设备丰富了人们的日常生活;具有拍照、摄像功能的电子设备随处可见,并随着智能手机的普及逐渐渗透到每个人的日常生活中,大量的视听设备产生了数量巨大的图像、影像,并伴随着网络的发展和社交平台的分享而快速传播;大量的图像传播的同时,人们对于图像识别和图像搜索技术的需求也在快速增长,可以说图像识别和图像搜索将成为搜索技术的发展方向。
在众多的图像识别技术中,对图像文字的识别技术显得尤为重要,这是因为图像文字往往比单纯图像包含更加重要的可利用信息,而且图像文字识别技术所应用的领域也很重要,比如说:银行签名的识别,交通管理网络中对于车牌号的追踪和识别,网络安全中对于验证码的识别;这些应用都关系到重要的经济活动或者社会管理活动。
目前图像文字识别中的难点在于:常见的待识别图像文字中往往包含各种噪声的干扰,比如说背景噪声、线条噪声、污染物噪声等;而且图像中的文字往往还具有一些扭曲特征,比如说旋转、倾斜等,目前在去除噪声干扰方面已经取得了良好的效果;但是对于倾斜等扭曲特征的判断和矫正仍然困难重重;而且现有技术中在进行图像中文字的识别时,首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后使用一定的方法对切分后的文字进行识别。而进行文字切分最常用的方法为投影法,即是将图像文字二值化处理后,通过垂直投影找到两个文字之间的分界线,根据分界线将文字切分开来。这样的切分方式在文字有倾斜的情况下,会变得比较复杂;因为文字倾斜的时候,相邻文字间经过垂直投影后的像素点可能会有重叠,这样就无法找到两个文字之间正常的界限;进而不能有效的对文字进行切分。
将倾斜的文字矫正,对于图像识别的意义重大;想要矫正倾斜文字,首先需要识别出文字倾斜方向和角度。目前有采用Hough变换的方法来得到倾斜的角度,进而对文字进行矫正,但是该方法的计算量特别大,很难满足识别的实时性的需求。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供一种图像识别中倾斜文字判断方法。本方法在图像中选取一行向量,通过将该行向量与文字每个笔画上的左右两侧的交点作为起始点,分别向左右两个方向追踪笔画的边缘点。如果笔画向左(或向右)倾斜,那么向右(或向左)寻找的像素数量就非常有限,若追踪到的像素点数量达到设置的阈值,则认为此次追踪有效;计算每次追踪的起点到终点的倾斜角度,通过分别统计向左和向右有效追踪类元素的个数,确定文字的倾斜方向。在此基础上,将对应类中最小的角度确定为文字的倾斜角度。通过本发明方法来判断文字倾斜角度的计算量较小,科学准确,实现过程简单,便于使用,具有较好的实时性。
为了实现上述发明目的,本发明提供了以下技术方案:
一种图像识别中倾斜文字判断方法,包含以下实现步骤:
(1-1)在图像中选择一行向量,确定该行向量与图像中文字每个笔画相交的最左侧像素点坐标值和最右侧像素点坐标值。
(1-2)以所述行向量与每个笔画相交的最左侧像素点为起点,向左上方追踪对应笔画的边缘点,并将判断结果存于Vector1中;具体的判断过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510608915.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序