[发明专利]印刷手写混合的数学公式数据生成方法及装置在审
申请号: | 201910962707.3 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110706317A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 曹润东;饶丰 | 申请(专利权)人: | 北京一起教育信息咨询有限责任公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06F40/111 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 林哲生 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写字符 印刷体字符 数学公式 字符意义 手写 印刷体数学公式 预设目标 图像集 印刷 子集 图像 数据生成 图像粘贴 背景图 预设 | ||
本发明实施例提供印刷手写混合的数学公式数据生成方法及装置,以生成印刷手写混合的数学公式。上述生成方法基于手写字符图像集,手写字符图像集包括多个子集,任一子集包括对应同一字符意义的多个不同形态的手写字符图像;不同子集对应不同的字符意义;生成方法包括:从多个预设题型中确定出至少一个题型(目标题型);在背景图上按照目标题型生成印刷体数学公式;印刷体数学公式中的每一印刷体字符对应一个位置;从与目标印刷体字符的字符意义相同的子集中,选择出手写字符图像;目标印刷体字符为预设目标位置所对应的印刷体字符;使用选择出的手写字符图像粘贴在预设目标位置,得到印刷手写混合的数学公式。
技术领域
本发明涉及网络技术领域,特别涉及印刷手写混合的数学公式数据生成方法及装置。
背景技术
随着互联网的普及,数学作业自动批改被越来越多的人所使用。例如:数学教师可批量拍照,使用作业自动批改服务对图像中的内容进行批改,一次完成对多份作业的批改,减轻教师基础性、重复性的批改动作;再例如,学生家长在检查数据作业时,可使用作业自动批改服务进行批改;再例如,学生完成作业后,可通过作业自动批改服务进行自查。
数学作业自动批改一般基于识别模型识别数学公式。模型在正式投入使用之前需要大量的数学公式样本进行模型训练。
在现实场景下,一个数学公式可能同时包含印刷体和手写体,如图1所示,印刷体通常为题目,而手写体通常为学生作答。如何生成包含印刷体和手写体的数学公式,以供后续的识别模型训练,是目前研究的热门。
发明内容
有鉴于此,本发明实施例提供印刷手写混合的数学公式数据生成方法及装置,以生成印刷手写混合的数学公式。
为实现上述目的,本发明实施例提供如下技术方案:
一种印刷手写混合的数学公式数据生成方法,基于手写字符图像集,所述手写字符图像集包括多个子集,任一子集包括对应同一字符意义的多个不同形态的手写字符图像;不同子集对应不同的字符意义;
所述生成方法包括:
从多个预设题型中确定出至少一个题型;确定出的题型为目标题型;
在背景图上按照所述目标题型生成印刷体数学公式;所述印刷体数学公式中的任一字符为印刷体字符;所述印刷体数学公式中的每一印刷体字符对应一个位置;
从与目标印刷体字符的字符意义相同的子集中,选择出手写字符图像;所述目标印刷体字符为预设目标位置所对应的印刷体字符;
使用选择出的手写字符图像粘贴在所述预设目标位置,得到印刷手写混合的数学公式。
可选的,在所述从多个预设题型中确定出至少一个题型之前,还包括:获取所述手写字符图像集。
可选的,所述获取所述手写字符图像集包括:获取图像集;所述图像集中的图像包含字符;从所述图像集的图像中截取出手写字符图像;根据截取出的手写字符图像的字符意义,将所述截取出的手写字符图像放入相应的子集中;以子集中的手写字符图像为原始图像进行数据增强处理,得到与所述原始图像的形态相差异的多个手写字符图像。
可选的,所述数据增强处理包括:旋转变换、颜色空间变换、平衡变换、尺度变换、高斯加噪中的至少一种。
可选的,选择出的手写字符图像为目标手写字符图像;所述使用选择出的手写字符图像粘贴在所述预设目标位置,得到印刷手写混合的数学公式包括:对所述目标手写字符图像进行预处理;将预处理后的目标手写字符图像粘贴在所述预设目标位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一起教育信息咨询有限责任公司,未经北京一起教育信息咨询有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910962707.3/2.html,转载请声明来源钻瓜专利网。