[发明专利]文字图像中字符识别方法和识别装置有效
申请号: | 201210477638.5 | 申请日: | 2012-11-21 |
公开(公告)号: | CN102982330A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 郝双 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 黄启行;方晓明 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 图像 字符 识别 方法 装置 | ||
技术领域
本发明涉及图像处理技术,尤其涉及文字图像中字符识别方法和识别装置。
背景技术
在对文本资料进行扫描后可以得到该文本资料的文字图像;OCR(OpticalCharacter Recognition,光学字符识别)技术是对文字图像中的字符进行识别后,转换成计算机文字的过程;其一般包括如图1所示的各步骤:
S101:获取文字图像后进行预处理。
将文本资料通过光学仪器,如影像扫描仪、传真机或任何摄影器材输入到计算机中形成文字图像。随着科技的进步,扫描仪等输入装置已制作的愈来愈精致,轻薄短小、品质也高,对OCR有相当大的帮助,扫描仪的分辨率使影像更清晰、扫除速度更增进OCR处理的效率。
一般来说,输入的图像格式并不唯一,对于不同的图像格式,有着不同的存储格式,不同的压缩方式,这要求计算机在读取图像信息的时候,要对各类常见图像格式具有较好的鲁棒性。
对文字图像的预处理一般包括:二值化、去除噪声、斜校正处理等。
对文字图像进行二值化:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色的文字图像进行处理,使图像只保留前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,从而生成彩色文字图像的二值化图。
对文字图像进行去除噪声处理:对于不同类型的文字图像,我们对噪声的定义可以不同,根据噪声的特征进行去噪,就叫做噪声去除。去除噪声后的文字图像版面更加整洁,文字轮廓边缘更加清晰,辨识度高。
对文字图像进行倾斜校正处理:用户在拍照文本资料时,一般都比较随意,因此拍照出来的文字图像不可避免的产生倾斜,这就需要文字识别软件进行较正。通常可以通过Hough变换等方法来进行倾斜校正。
S102:对文字图像进行版面分析。
对经过预处理后的文字图像进行版面分析。将文字图像分段落,分行的过程就叫做版面分析。
S103:对文字图像进行字符切割。
在经过版面分析后,确定出文字图像中的每行文字,将整行文字中的各个字符一个一个分离出来的过程就是字符切割。对于英文字母和阿拉伯数字等字符,通常采用连通域标记的方法将字符准确的切割开来。但对于汉字而言,由于汉字存在偏旁部首结构,仅仅依靠连通域标记来进行字符切割会影响识别的准确率,所以还要考虑到字符宽度等信息。
S104:对切割出的每个单个字符进行字符识别。
针对上述步骤S103中切割出的每个单个字符进行识别。早期的字符识别是通过模板匹配的方式来实现的,后来以特征提取为主,用什么特征、怎么抽取,直接影响识别的好坏。目前常见的特征可分为两类:一为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在匹配时,采用基本的数学理论就可以进行判别。而另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点的数量及位置,或以笔划段为特征,配合特殊的匹配方法,进行比对。
目前,单个字符的识别方法为:对单个字符进行特征提取,将提取到的特征与模版库中特征进行匹配,可以得到至少一个候选字,从中选取相似度最高的候选字作为该字符的识别结果输出。
S105:基于识别的字符进行版面恢复。
将识别出字符依据文字图像中的版面进行排列,“段落不变,位置不变,顺序不变”的输出到word文档、或pdf文档等,这一过程就叫做版面恢复。
然而,本发明的发明人发现,现有技术在进行字符识别时,仅采用字符形状相似度作为判断、识别的依据,会产生较大的误识率;换言之,现有技术的字符识别方法的准确率不高,具有提高字符识别准确率的需求。
发明内容
本发明的实施例提供了一种文字图像中字符识别方法和识别装置,用以提高字符识别准确率。
根据本发明的一个方面,提供了一种文字图像中字符识别方法,包括:
对所述文字图像中切割出的字符,以设定单位进行划分;并对每个设定单位内的字符进行识别:
对所述设定单位内的每个字符进行特征提取和特征匹配后,确定每个字符的候选字;
针对所述设定单位内的每个字符,确定该字符的每个候选字的相似度、以及该字符的每个候选字与该字符相邻的字符的候选字之间的转移概率;
根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210477638.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种非时效中强度全铝合金导线
- 下一篇:烧录治具
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序