[发明专利]一种用于成绩评价的识别手写实验报告的方法在审
申请号: | 201610389442.9 | 申请日: | 2016-06-06 |
公开(公告)号: | CN107463866A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 孙锡泉 | 申请(专利权)人: | 青岛大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266071 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 成绩 评价 识别 手写 实验 报告 方法 | ||
技术领域
本发明涉及学生成绩评价领域,更具体地涉及学生成绩智能评价技术领域。
背景技术
学生在做各种实验时通常会手写实验报告,然后教师对学生提交的手写实验报告采取人工批改的方式,主要的批改内容包括文字的准确性、书写的工整性、数据的准确性等。教师批改时要详细阅读后给予批改意见和成绩,工作量很大,劳动强度很高。此外教师很难保证统一标准予以批改,导致出现同等质量的报告而成绩不同的现象发生,学生成绩衡量失准。
目前对手写的作业、实验报告、试卷等的智能批改、自动批改还尚未普及,原因主要是涉及到手写文字的识别的准确率、文字内容的分数评定的问题。
现有的手写文字识别技术有以下方式,第一种方式是手写输入的识别,即联机手写体识别,人一边写,计算机一边识别,这是一种实时识别方式,结合笔画、笔顺,实时生成备选汉字,输入者选择正确文字;另一种是手写文字稿的识别,将大量已经生成的手写文字通过光学字符识别方式(OCR方式)予以识别,由于手写者的书写习惯、文字特征不同,实现自由手写体识别相当困难,识别时需要预先学习才能够识别相应手写者的文字,整体讲,识别率明显低于印刷字体,无法用于手写的作业、实验报告、试卷等的批改。
另外,就目前来说,文字内容的分数评定也存在问题。例如,得分点不固定。按得分点赋分可以分为两种:一种是按词,即写到一个固定的关键词就赋分;另一种是按意,即写到类似的意思就赋分。前者容易实现,单个语词读取在技术上没有太大困难。但后一种赋分方式需要实现语义的识别,这种技术还有很大的难题。
除了按点赋分问题外,还含有一些格式、逻辑、搭配问题,比如标题、抬头,落款等,也大大降低了文字内容的分数评定的准确性。
发明内容
本发明的目的是提供一种用于成绩评价的识别手写实验报告的方法。常见的汉字识别技术往往不能达到实际要求,而学生的实验报告是根据已有的标准实验报告模板所写,可作为识别的参照,可以大大提高识别的准确度。同时,将纸质报告转换为电子报告存档后,就不用占用大量的场地,节省教学资源,还有当需对某学生实验报告进行复查时,教师不需要在成堆的实验报告中寻找,而可以迅速查到学生的实验报告。
一种用于成绩评价的识别手写实验报告的方法,包括以下步骤:S0:开始;S1:输入实验报告模板,将学生实验报告转化为电子图像;S2:对获取的学生实验报告电子图像进行预处理;S3:将学生实验报告电子图像分割成信息区和报告区;S4:对报告区进行图像相似度分析;S5:分别对信息区、报告区进行字符识别;S6:输出识别的文字结果、输出识别过程与结果的技术参数用于学生实验报告成绩评价;S7:结束。
优选地,所述步骤(S2)中的预处理包括平滑去噪、倾斜校正。必要的时候也可以图像二值化。
通常,学生实验报告扫描图像可能会由于光线、纸张扫描设备的差异而有不同区别,且纸张的洁白度、油墨深浅、纸张摆放角度等对文字的识别都会有影响,因此在后续识别之前必须进行预处理。
在对图像进行预处理后,图像识别效果有较大提高。
学生实验报告有两个区域,信息区和报告区,信息区和报告区有着显著的差异。信息区在学生实验报告页面的上部,包含印刷体的姓名、学号、班级、实验名称等项目名称,项目名称周边有一填空处,填空处有时有下划线,学生在填空处填写相应的信息,有些还有条码、二维码等印刷体字符。报告区是学生手写的实验报告部分,包含实验目的,实验原理、实验器材、实验内容、实验数据、实验总结、思考和讨论等,有文字、图形、公式等多种形式。
优选地,所述步骤(S3)中将学生实验报告电子图像分割成信息区和报告区的方法如下:
(1)识别:将实验报告的文字、字符进行行切割、字切割,识别出印刷体项目名称;
(2)比对:将识别出的印刷体字符的信息和实验报告模板中的相应内容、实验数据库中的相应信息进行比对;
(3)划分:如果项目名称和实验报告模板中的相应内容相符,则将印刷体的项目名称所在的行作为信息区,将其余的行作为报告区,如果项目名称和实验报告模板中的相应内容不相符,则重新识别。
在所述步骤(S3)中的行切割、字切割可以采用任何可行的公知技术。
可能存在多个同学将同一份实验报告转化为电子图像,分别用作各自实验报告的情况,这种情况意味着报告存在真实性问题,因此需要进行真实性检验,保证每个同学独立完成各自的实验报告。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛大学,未经青岛大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610389442.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:月饼包装盒(福月呈祥)
- 下一篇:淋浴房(L5101方形合页)