[发明专利]一种文字类型检测模型的构建方法和计算设备有效
申请号: | 201810128155.1 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108304814B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 徐行;刘辉;刘宁;张东祥;郭龙;陈李江;李启林 | 申请(专利权)人: | 海南云江科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 571924 海南省老*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 类型 检测 模型 构建 方法 计算 设备 | ||
本发明公开了一种文字类型检测模型的构建方法及文字类型检测方法,适于在计算设备中执行,模型构建方法包括:采集训练图片;将各训练图片扩充为一张方形图片;获取对各方形图片的印刷体文字区域和手写体文字区域进行标注后的结果;根据各训练图片及其标注结果对卷积神经网络进行训练,得到文字类型检测模型。检测方法包括:获取待识别的原始图片,将该原始图片切分为多个子图;采用文字类型检测模型分别检测各子图中的印刷体文字区域和手写体文字区域,得到各文字区域的坐标信息及其文字类型;将分属于不同子图的相临切的同一类型的文字区域进行合并,得到原始图片中的印刷体文字区域和手写体文字区域。本发明还公开了对应的计算设备。
技术领域
本发明涉及图像数据处理领域,尤其涉及一种文字类型检测模型的构建方法、文字类型检测方法和计算设备。
背景技术
随着计算机和互联网技术的发展,人们越来越多的使用自动化设备对学生考试试卷进行阅卷。在试卷分析时中,经常需要识别每个识别区域的文字是手写字体还是印刷字体。目前的文字识别方法通常基于字符颜色或简答的文字特征进行识别。这种方法对图像的质量要求非常高,如果图像有阴影或出现手写浸入和模糊等情况,则会造成检测精度过低的问题。而且,这种方法通常只能基于水平行文字进行分割检测,其对旋转图像的无法进行很好的检测。另外,文字本身具有多种特征,仅基于颜色特征对手写文字的检测区分未能充分挖掘手写文字的特征,进而在一定程度上限制了其检测效果。
因此,需要提供一种更有效的手写体文字和印刷体文字的检测方法。
发明内容
鉴于上述问题,本发明提出了一种文字类型检测模型的构建方法、文字类型检测方法和计算设备,以力图解决或者至少解决上面存在的问题。
根据本发明的一个方面,提供一种文字类型检测模型的构建方法,适于在计算设备中执行,该方法包括:采集训练图片,其中每张训练图片包含有印刷体文字和手写体文字中的至少一种;根据各训练图片的长宽值将各训练图片扩充为一张方形图片;获取对各方形图片的印刷体文字区域和手写体文字区域进行标注后的结果;以及根据各训练图片及其标注结果对卷积神经网络进行训练,得到文字类型检测模型。
可选地,在根据本发明的文字类型检测模型的构建方法中,卷积神经网络包括6层卷积层和2层全连接层。
可选地,在根据本发明的文字类型检测模型的构建方法中,卷积神经网络中中间卷积层的卷积核包括3*3卷积核、5*5卷积核和7*7卷积核,最后的输出层包括印刷体文字区域、手写体文字区域和背景区域3种类别。
可选地,在根据本发明的文字类型检测模型的构建方法中,对方形图片的印刷体文字区域和手写体文字区域进行标注的操作包括:确定该方形图片中的各文本行以及各文本行中的文字区域;逐行对各文本行的文字区域类型进行标注,文字区域类型包括印刷体文字区域和手写体文字区域;以及将各文本行中的各文字区域的坐标信息及其所属的文字类别进行保存。
可选地,在根据本发明的文字类型检测模型的构建方法中,根据图片的长宽值将训练图片扩充为一张方形图片的步骤包括:选取长和宽中的较大值构架一个为白色背景图像,并将该训练图片放在白色背景图像的中心。
根据本发明的又一个方面,提供一种文字类型检测方法,适于在计算设备中执行,计算设备中存储有文字类型检测模型,文字类型检测模型适于采用如上所述的文字类型检测模型的构建方法构建,文字类型检测方法包括:获取待识别文字类型的原始图片,并将该原始图片切分为多个子图,其中各子图不重叠且连接;采用文字类型检测模型分别对每个子图中的印刷体文字区域和手写体文字区域进行检测,得到其中各文字区域的坐标信息及其所属的文字类型;以及分别将分属于不同子图且相临切的同一类型的文字区域进行合并,并将所有子图中的印刷体文字区域集合和手写体文字区域集合作为该原始图片中的印刷体文字区域和手写体文字区域
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南云江科技有限公司,未经海南云江科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810128155.1/2.html,转载请声明来源钻瓜专利网。