[发明专利]基于移动设备的问卷和表格数字化识别方法及系统有效
申请号: | 201510253647.X | 申请日: | 2015-05-18 |
公开(公告)号: | CN104881641B | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 翟广涛;林伟;胡春嘉;高忠派 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/42 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 徐红银;郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 移动 设备 问卷 表格 数字化 识别 方法 系统 | ||
本发明提供一种基于移动设备的问卷和表格数字化识别方法及系统,首先根据纸质问卷或者表格图片的角点特征,训练样本图片,在背景中分割出问卷或表格,然后根据OpenGL系统中的坐标变换,将物体坐标转换为屏幕坐标并通过仿射变换来校准各种位置的问卷或表格,接着进行图像处理,按照顺序将表中的选项数字化,根据选择框中黑色区域占整个区域的比例来判读该选项是否被选,输出被选中的选项的数字标号。最后,根据数字标号和本地建立的问卷或者表格选项内容的SQL库,输出被选中的选项及内容。本发明能识别不同背景和光照下的问卷和表格,鲁棒性强,识别一张问卷大致花费几秒钟,准确率几乎达到百分之百,快速而高效。
技术领域
本发明涉及的是一种机器学习和图像处理技术领域的系统,具体是一种基于移动设备的快速高效的问卷和表格数字化识别方法及系统。
背景技术
问卷和表格在当今社会生活中被广泛地使用。比如开展一个新的项目或者生产一个新的产品,都要通过市场问卷调查来分析项目的可行性或者产品的需求量。同样在银行或则学校,通常需要填写一些表格来登记注册信息。虽然现在网络调查和注册已经越来越流行了,但是纸质的问卷和表格对于调查和统计分析也是必不可少的。由于市场上识别纸质问卷和表格的设备或者应用太少,当这些问卷或者表格被填写好后,问卷和表格的统计分析只能靠人工来进行,需要大量的人力和物力,这既消耗了大量的人力和物力,也浪费里宝贵的时间。所以设计需要一个快速高效的问卷和表格识别来帮助工作人员完成对纸质问卷和表格的数据的统计和录入工作。
要实现问卷和表格的数字化识别,需要实现问卷和表格的分割、标定和识别三个部分。对于图像分割,传统的方法有基于颜色分割、差分运动检测分割和Adaboost训练分类器来进行分割。由于纸质问卷和表格一般只有白色和黑色两种颜色,包含的颜色信息不多,所以采用颜色分割的效果不好;而识别问卷和表格一般通过拍照采用静态识别,不包含运动的信息,所以差分运动检测的效果也不甚理想;最后,通过训练Adaboost分类器来识别问卷和表格,Adaboost分类器是机器学习里面的一种训练方法,但这项工作需要大量的样本图片才能确定较好的效果,而且分类器在复杂环境下和光照变化较大的情况下,识别率较低;对于图像标定,一般通过检测直线的交点来计算出纸质的问卷和表格的四个角的坐标,然后通过仿射变换来校准图片,但在复杂环境下,直线检测不太稳定,并且计算出来的角点的坐标存在偏差,严重的影响了后续步骤。另外二维码识别的方法来标定图片的方法,设定标志来标定图片,但对于问卷和表格,设定标准显得太过复杂,不切实可行。表格识别部分,一般的想法是通过文字识别来判断出被选中的选项,但对于文字的识别过于复杂,现有的技术对文字的识别率较低,可行性较低。
现有专利中,如申请号为CN201310455065.0中国发明专利,该专利提供了一种表格识别方法与系统,但该技术通过分割出表格的基本图元,采用无向图,抽取页面内的图像,检测水平和垂直直线的交叉点,检测交叉点的外包络矩阵,将所述分割文本行是否落入外包络矩阵作为局部关系特征,然后使用聚类和SVM向量机等机器学习的方法建立表格模型来识别表格。该方法只是在整个文档中找到表格,而对于表格中的内容没有做任何的识别,类似于对表格的分割,而且在对表格的识别过程中文档必须竖直放置,对于文档旋转和有遮挡的情况下,识别率较低。并且该技术只是纯粹的对表格的识别,而对于表格中的内容没有做任何处理,对于表格的数据统计的用处不大。
基于上述,需要设计一种新的识别方法和系统,来在复杂环境先分割出问卷和表格,并且识别出表格和问卷中那些被选择的内容以方便数据的统计分析,增加实用性。
发明内容
针对上述现有技术的不足,本发明提供一种快速高效的移动设备问卷和表格数字化识别方法及系统,可以快速而高效的识别了整个问卷或者表格,准确率几乎达到百分之百,方便工作人员对问卷和表格信息的统计和录入。
为实现上述目的,本发明采用以下技术方案:
根据本发明的一方面,提供一种基于移动设备的问卷和表格数字化识别方法,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510253647.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预制装配分段式楼梯结构
- 下一篇:轻质隔热耐火浇注层