[发明专利]基于云计算的文本扫描识别方法无效
申请号: | 201310145112.1 | 申请日: | 2013-04-25 |
公开(公告)号: | CN104123550A | 公开(公告)日: | 2014-10-29 |
发明(设计)人: | 魏昊;张磊 | 申请(专利权)人: | 魏昊;张磊 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/54 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 王清义 |
地址: | 江苏省南京市白下区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 计算 文本 扫描 识别 方法 | ||
技术领域
本发明涉及一种文本扫描识别的方法,尤其涉及一种基于云计算的文本扫描识别方法。
背景技术
图像识别技术是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。例如模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。这个模型简单明了,也容易得到实际应用。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,而事实上人不仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字母A。同时,人能识别的图像是大量的,如果所识别的每一个图像在脑中都有一个相应的模板,也是不可能的。为了解决模板匹配模型存在的问题,格式塔心理学家又提出了一个原型匹配模型。这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。这种模型从神经上和记忆探寻的过程上来看,都比模板匹配模型更适宜,而且还能说明对一些不规则的,但某些方面与原型相似的图像的识别。但是,这种模型没有说明人是怎样对相似的刺激进行辨别和加工的,它也难以在计算机程序中得到实现。因此又有人提出了一个更复杂的模型,即“泛魔”识别模型。
具体而言,现有的影像识别技术有如下几种:国内的汉王,紫光文通,尚书7号,国外的Abbyy FineReader11 等。这些方案都着重于对于纯文字的识别率,即OCR,但对整体的识别准确率,特别是对有超高识别率要求的特别域-即有效识别率,没有太多的考虑和设计。同时,由于OCR/ICR的效率问题,往往处理速度较慢,无法应对高时效的要求。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种识别速度快、识别准确率高的基于云计算的文本扫描识别方法。
为实现上述技术目的,本发明采取的技术方案为一种基于云计算的文本扫描识别方法,其特征在于包括以下步骤:
第一步,文档图像预处理:针对从扫描仪直接扫描出的原始图像进行预处理,以将原始图像二值化并且去除原始图像噪点,将扭曲的原始图像还原,将原始图像压缩以便后续图像处理;
第二步,文档图像版面特征分析:将预处理文档图像加载到版面分析引擎进行处理,以获得预处理文档图像版面特征信息;
第三步,文档图像掩膜:根据预处理文档图像的版面特征信息,添加相应的掩膜,然后对关键域进行局部处理,即提取预处理文档图像的版面特征信息并与掩模的特征信息进行匹配;
第四步,碎片化:即文档图片定位与分割,具体为采用图像局部特征定位方法、表格识别方法和OCR关键字符识别定位方法,对经过文档图像掩膜步骤处理后的预处理文档图像进行切碎处理;
第五步:碎片的OCR/ICR识别:识别小碎片,拼接并输出文字,以便进行语意识别;
第六步,语意识别:利用统计语言模型算法结合行业辞典,对OCR/ICR的结果进行逻辑校验。
作为本发明进一步改进的技术方案,所述文档图像预处理包括以下步骤:
首先,对原始图像采用权平均法进行处理后,再采用最大类间方差进行二值化处理,将原始的真彩色以及高DPI的灰度图转化为二值化的黑白图;
其次,对二值化的黑白图进行图像去噪,以去除了扫描过程中由于电子信号干扰带来的图像噪点,形成预处理文档图像;
第三,对预处理文档图像进行纠偏处理,使扭曲的图像还原。
作为本发明进一步改进的技术方案,所述文档图像版面特征分析为:通过版面分析算法搜索整个预处理文档图像并对预处理文档图像进行区域划分和类型识别,以获得预处理文档图像的版面特征信息,所述版面特征信息包括区域分割线坐标信息、预处理文档图像的类型信息以及预处理文档图像中的文字对象的坐标信息;
作为本发明进一步改进的技术方案,所述预处理文档图像的类型信息包括文字、图章、图片、公式和条码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于魏昊;张磊,未经魏昊;张磊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310145112.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种里程表平面齿自动定位铣削机
- 下一篇:一种过盈螺栓装配用气动机械式拉力机