[发明专利]一种基于OCR的快速纸笔投票结果自动采集与识别系统在审

专利信息
申请号: 201610070407.0 申请日: 2016-01-31
公开(公告)号: CN105740857A 公开(公告)日: 2016-07-06
发明(设计)人: 高学;李莎;金连文 申请(专利权)人: 华南理工大学
主分类号: G06K9/22 分类号: G06K9/22;G06K9/54;G07C13/00
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 ocr 快速 投票 结果 自动 采集 识别 系统
【权利要求书】:

1.一种基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于包括高速图像采集模块、基于最大类间方差方法的图像二值化模块、基于两级检测的快速图像倾斜检测和校正模块、投票区域及表决票标识码定位模块、基于投影分析的字符提取模块、基于多方向梯度特征与距离分类器的字符识别模块、基于多线程的结果校验模块、投票结果统计分析与存储模块;图像处理模块接收到表决票图像后,系统将依次对图像进行二值化处理、图像的倾斜检测和矫正、投票区域及标识码的定位、基于投影分析的符号提取和基于多方向梯度特征与距离分类器的字符识别。

2.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:

还包括高速扫描仪,实现表决票的快速图像采集,并将图像传输到高性能电脑保存;用户只需将投票后的表决票放置到扫描仪中,并触发扫描,就可以将表决票图像保存到电脑的指定目录。

3.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:所述高速图像采集模块负责对高速扫描仪进行控制,并将采集的表决票灰度图像传输到高性能电脑进行存储。

4.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:所述基于最大类间方差方法的图像二值化模块对扫描图像进行二值化,采用基于最大类间方差方法进行图像二值化;首先利用最大类间方差方法确定分割图像前景与背景的阈值T,然后计算图像的最大和最小灰度值;若最大与最小灰度值差超过预先设定的值,则利用阈值T进行二值化,否则图像二值化为全背景,并标识该表决票为空白票或废票。

5.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:基于两级检测的快速图像倾斜检测和校正模块对二值化图像进行倾斜角度检测和图像倾斜校正,采用基于投影轮廓分析的倾斜角度检测方法;检测策略则采取两级检测的方法,首先采取较大的角度间隔,每隔一个角度间隔计算其投影轮廓方差,取最大方差对应的角度为估计的倾斜角度;然后,对估计的倾斜角度中设定范围内的角度,以较小的角度间隔计算其投影轮廓方差,取最大方差对应的角度为图像精确倾斜角度。

6.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:投票区域及表决票标识码定位模块通过水平投影和竖直投影分别计算倾斜校正后的二值化图像的水平和竖直投影轮廓,找出投影轮廓的峰值从而确定投票表格的横线和竖线,最终定位出表决票的投票区域,并利用表决票的几何布局特性定位表决票的标识码区域;若定位失败,则标识该票为废票。

7.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:所述基于投影分析的字符提取模块采用水平和竖直投影的方法在得到的投票区域及标识码区域内计算投影轮廓,找出投影轮廓的谷值从而提取出投票标记符号图像,以及表决票标识码中的字符图像。

8.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:所述基于多方向梯度特征与距离分类器的字符识别模块首先将待识别字符图像进行基于笔画间隔的非线性归一化,归一化后的图像大小为,然后提取512维的8方向梯度特征,字符分类则采用基于欧式距离度量的分类方法;

对表决票的标识码进行识别,根据表决票标识码对投票识别结果进行统计,并将投票识别结果与标识码识别结果与表决票图像进行关联;除了对标识码进行识别外,该模块还对标识码进行检查,若识别的标识码超出给定范围,则将对应的表决票标识为废票。

9.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:基于多线程的结果校验模块,包括投票符号的人工校对和表决票标识码的人工校对;该模块采用多线程的方式进行实现,与投票结果识别过程同步进行;投票符号的校对功能将每张表决票的投票区域截取出来,并根据投票定位结果将投票区域背景设置为不同颜色,以便于人工辨识;校验人可以通过鼠标双击改变背景颜色从而修改投票结果;表决票标识码校对功能将标识码按从小到大的顺序排列显示,校验人能方便地对识别错误的表决票标识码进行辨识并修改。

10.根据权利要求1所述的基于OCR的快速纸笔投票结果自动采集与识别系统,其特征在于:投票结果统计分析与存储模块对校正完成的投票结果进行统计,并将统计结果自动导出到excel电子表格文档中;导出的excel电子表格文档具有自动打印功能,能方便地进行打印归档与存储。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610070407.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top