[发明专利]一种基于答案库的手写样本集的自动生成方法有效
申请号: | 201910678950.2 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110378310B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 田博帆 | 申请(专利权)人: | 南京红松信息技术有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V40/30;G06V30/14;G06F16/33 |
代理公司: | 南京北辰联和知识产权代理有限公司 32350 | 代理人: | 陆中丹 |
地址: | 210022 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 答案 手写 样本 自动 生成 方法 | ||
1.一种基于答案库的手写样本集的自动生成方法,其特征在于,具体包括以下步骤:
(1)手印分离:将含有手写体文本的作业或试卷的图片中的印刷体和手写体字符进行分离;
(2)字符定位:对已分离出的手写体的字符图片,对所述字符图片中的字符进行定位,得到手写体字符的定位坐标;
(3)答案获取:首先确定各题目的答案区,再确定手写体的答案坐标;
(4)答案对齐:结合不同题型的数目和存储在答案数据库中的答案个数信息,对题目的答案做实际排序和对齐操作,完成检测答案和答案库数据的对应关系;
(5)答案分类:根据答案库的数据信息,直接判断出字符类别,并裁剪出对应的手写体答案,将裁剪的答案图片作为基础样本保存至对应的文件夹中;
(6)样本合成:根据步骤(5)得到的基础样本的数据集,通过随机读取文件夹名和文件夹中的文件,将获取到的答案图片统一等比缩放至高度为32个像素的大小,再按照矩阵行拼接的方式对数字化的图片进行自动合成,最终得出训练样本集。
2.根据权利要求1所述的基于答案库的手写样本集的自动生成方法,其特征在于,所述步骤(1)手印分离通过模板匹配的方式对含有手写体文本的作业或试卷的图片中的印刷体和手写体的字符进行分离的具体步骤包括:
S11图片矫正:将空白模板和含有手写体文本的作业或试卷图片经过二值化处理、轮廓提取和霍夫变换检测矫正图片的倾斜度;
S12手写分离:将含有手写体文本的作业或试卷图片中的手写体和印刷体进行分离得到纯手写体图片。
3.根据权利要求1所述的基于答案库的手写样本集的自动生成方法,其特征在于,所述步骤(2)通过独立边缘像素检测方法对字符定位的具体步骤包括:
S21文本定位:对得到所述纯手写体图片中的手写体文本进行定位;
S22直线检测:检测所述步骤S21中定位到的所述手写体文本中是否有直线,若有直线则采用水平和垂直核卷积技术来检测直线的具体位置并输出其坐标值;S23干扰筛选:对所述纯手写体文本进行干扰字符筛选,并将干扰的手写体字符去掉,得到所需的手写体字符的坐标。
4.根据权利要求2所述的基于答案库的手写样本集的自动生成方法,其特征在于,所述步骤S12具体包括以下步骤:
S121模板匹配:将步骤S11中的所述空白模板通过至少两种匹配算法利用空白模板的滑动寻找匹配点,将含有手写体文本的作业或试卷图片与所述空白模板进行粗匹配;
S122模板裁剪:将步骤S121中的与所述含有手写体文本的作业或试卷图片粗匹配好的所述空白模板进行裁剪,使所述空白模板的大小与所述含有手写体文本的作业或试卷图片的大小相同;
S123特征配准:采用尺度不变特征变换的SIFT算法来寻找关键特征点,使所述空白模板与所述含有手写体文本的作业或试卷图片中的文本内容重合,使所述空白模板与所述含有手写体文本的作业或试卷图片配准;
S124差异检测:对步骤S123中配准后的所述含有手写体文本的作业或试卷图片,采用不同区域检测算法将其和所述空白模板图片进行对比检测,找出所述空白模板与所述含、有手写体文本的作业或试卷图片中的不同区域得到检测结果图,记为图A;
S125模板相减:将步骤S123中配准后的所述含有手写体文本的作业或试卷图片,通过对所述空白模板和所述含有手写体文本的作业或试卷图片采用模板灰度处理后得到的值进行直接相减操作,得到相减结果图,记为图B;
S126相同检测:将步骤S124得到的图A与步骤S25得到的图B通过异或运算法去掉图片中手写部分的内容,得到图C;
S127手写提取:再次将所述图A和图B做或运算得到重叠后的全部文本内容,记作图D;再将图D与图C做相减运算,再经腐蚀处理及高斯去噪后,得到最终的所述纯手写体图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京红松信息技术有限公司,未经南京红松信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910678950.2/1.html,转载请声明来源钻瓜专利网。