[发明专利]一种基于答案库的手写样本集的自动生成方法有效
申请号: | 201910678950.2 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110378310B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 田博帆 | 申请(专利权)人: | 南京红松信息技术有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V40/30;G06V30/14;G06F16/33 |
代理公司: | 南京北辰联和知识产权代理有限公司 32350 | 代理人: | 陆中丹 |
地址: | 210022 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于答案库的手写样本集的自动生成方法,具体包括以下步骤:(1)手印分离:将含有手写体文本的作业或试卷的图片中的印刷体和手写体字符进行分离;(2)字符定位:对所述字符图片中的字符进行定位,得到定位坐标;(3)答案获取:确定手写体的答案坐标;(4)答案对齐:对题目的答案做实际排序和对齐操作,完成检测答案和答案库数据的对应关系;(5)答案分类:根据答案库的数据信息判断出字符类别并裁剪出对应的手写体答案,将裁剪的答案图片作为基础样本保存至文件夹中;(6)样本合成:根据步骤(5)得到的基础样本的数据集通过随机读取文件夹名和文件夹中的文件,自动合成出训练样本集。 | ||
搜索关键词: | 一种 基于 答案 手写 样本 自动 生成 方法 | ||
【主权项】:
1.一种基于答案库的手写样本集的自动生成方法,其特征在于,具体包括以下步骤:(1)手印分离:将含有手写体文本的作业或试卷的图片中的印刷体和手写体字符进行分离;(2)字符定位:对已分离出的手写体的字符图片,对所述字符图片中的字符进行定位,得到手写体字符的定位坐标;(3)答案获取:首先确定各题目的答案区,再确定手写体的答案坐标;(4)答案对齐:结合不同题型的数目和存储在答案数据库中的答案个数信息,对题目的答案做实际排序和对齐操作,完成检测答案和答案库数据的对应关系;(5)答案分类:根据答案库的数据信息,直接判断出字符类别,并裁剪出对应的手写体答案,将裁剪的答案图片作为基础样本保存至对应的文件夹中;(6)样本合成:根据步骤(5)得到的基础样本的数据集,通过随机读取文件夹名和文件夹中的文件,将获取到的答案图片统一等比缩放至高度为32个像素的大小,再按照矩阵行拼接的方式对数字化的图片进行自动合成,最终得出训练样本集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京红松信息技术有限公司,未经南京红松信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910678950.2/,转载请声明来源钻瓜专利网。