[发明专利]一种基于光学字符识别的传真图像分类方法在审

申请号：	201810111564.0	申请日：	2018-02-05
公开（公告）号：	CN110119648A	公开（公告）日：	2019-08-13
发明（设计）人：	高圣翔;黄远;万辛;安茂波;李鹏;孙晓晨;沈亮;金鑫;徐及;刘珈麟;颜永红	申请（专利权）人：	国家计算机网络与信息安全管理中心;中国科学院声学研究所
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06K9/40;G06K9/62
代理公司：	北京方安思达知识产权代理有限公司 11472	代理人：	陈琳琳;杨青
地址：	100029***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	传真图像分类光学字符识别噪声消除预处理二值化处理二值化图像实时性要求输出字符串电子扫描仿射变换灰度图像频谱噪声二值化置信度校准转写匹配自动化扫描文本
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于光学字符识别的传真图像分类方法，所述方法包括：步骤1)对扫描得到的传真图像进行噪声消除；步骤2)对噪声消除后的传真图像进行二值化处理；步骤3)对步骤2)得到的二值化图像进行仿射变换校准文本；步骤4)利用OCR方法对步骤3)处理后的传真图像进行识别，得到编码为UTF‑8的输出字符串和转写置信度；步骤5)对字符串进行关键词正则匹配，得到传真图像的分类。本发明的方法利用频谱噪声消除和灰度图像二值化的预处理，在满足实时性要求的前提下提升了电子扫描得到的传真图像的质量；使传真图像能够使用基于OCR的分类方法，由此实现了传真图像的自动化分类。

技术领域

本发明涉及传真图像自动分类方法，特别涉及一种基于光学字符识别的传真图像分类方法。

背景技术

传真图像主要通过对出版物进行电子扫描得到，其主要组成是标准打印字体，手写字体和其他非文字单元(如图表)。传真图像分类技术可以根据指定的类别对传真图像进行分类，起到信息归类划分的作用。

传统的传真图像分类主要依靠操作人员手工进行。这种依靠人工的分类方法，效率低下，准确率依赖于操作人员的经验和判断，缺乏客观统一指标。同时，传统的OCR(光学字符识别方法)对电子扫描文本的质量要求较高，不能直接用在传真图像上进行分类。

发明内容

本发明的目的在于通过适当的图像预处理算法提高传真图像的质量，利用OCR方法对传真图像进行分类。

为了实现上述目的，本发明提出了一种基于光学字符识别的传真图像分类方法，所述方法具体包括：

步骤1)对扫描得到的传真图像进行噪声消除；

步骤2)对噪声消除后的传真图像进行二值化处理；

步骤3)对步骤2)得到的二值化图像进行仿射变换校准文本；

步骤4)利用OCR方法对步骤3)处理后的传真图像进行识别，得到编码为UTF-8的输出字符串和转写置信度；