[发明专利]一种题目录入方法、题目录入装置、电子设备及计算机可读存储介质在审

专利信息
申请号: 202110122288.X 申请日: 2021-01-28
公开(公告)号: CN112861864A 公开(公告)日: 2021-05-28
发明(设计)人: 孙永毫;徐强 申请(专利权)人: 广东国粒教育技术有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/20;G06K9/40;G06K9/46;G06K9/62
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 卢泽明;李宇亮
地址: 519000 广东省珠海市横琴新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 题目 录入 方法 装置 电子设备 计算机 可读 存储 介质
【权利要求书】:

1.一种题目录入方法,其特征在于,包括以下步骤:

S1,获取初始图片,对所述初始图片进行改质处理而得到第一图片;

S2,获取所述第一图片中的题目位置信息,得到对应所述题目位置信息的题目图片;

S3,对所述题目图片进行文字识别以获得题目字符信息;

S4,判断题库中是否有匹配所述题目字符信息的题目,若否,则去除所述题目图片中的手写内容以获得题目文本;

S5,对所述题目文本进行结构化文本解析以获得题型描述特征,对所述题目图片进行识别以获得排版格式特征与试题特征,所述题型描述特征、所述排版格式特征与所述试题特征为所述题目结构化数据;

S6,发送所述题目结构化数据至智能终端以使其录入所述题目结构化数据。

2.根据权利要求1所述的题目录入方法,其特征在于:

所述步骤S4包括,

S41,对所述题目字符信息进行预处理。

3.根据权利要求2所述的题目录入方法,其特征在于:

所述步骤S4包括,

S42,将所述题目字符信息输入至BERT预训练中文模型,所述BERT预训练中文模型识取所述题目字符信息而将其转换为题目句特征向量。

4.根据权利要求3所述的题目录入方法,其特征在于:

所述步骤S4包括,

S43,将句特征向量遍历题库,将所述题库中的题目文本转换为题库句特征向量,根据所述题目句特征向量与所述题库句特征向量而判断所述题库中是否有匹配所述题目字符信息的题目。

5.根据权利要求4所述的题目录入方法,其特征在于:

在所述步骤S43中,若所述题目句特征向量与所述题目句特征向量的相似度不小于预设阈值,则判断结果为是,确认所述题目句特征向量对应的题目为目标文本,发送所述目标文本至智能终端。

6.根据权利要求5所述的题目录入方法,其特征在于:

所述步骤S4包括,

S44,所述智能终端确认录入确认所述目标文本。

7.根据权利要求4所述的题目录入方法,其特征在于:

在所述步骤S43中,若判断结果为否,则执行作为步骤S45的去除所述题目图片中的手写内容以获得题目文本。

8.根据权利要求7所述的题目录入方法,其特征在于:

所述步骤S45包括,

S451,通过区域识别模型而识别所述第一图片中的手写区域与印刷区域,通过像素识别模型而对所述手写区域进行像素识别以确定在所述手写区域中的手写内容所对应的手写内容像素;

S452,获取替换像素值,利用替换像素值替换手写内容像素的像素值以去除手写内容,所述替换像素值是所述手写区域中除了所述手写内容像素之外的任意一个像素的像素值,或者,所述替换像素值为所述手写区域中除了所述手写内容像素之外的所有像素的像素值的平均值:

S453,从去除手写内容后的所述第一图片输出中间图像,对所述中间图像进行二值化处理以获得输出图像,识取所述输出图像中的文字以获得题目文本。

9.根据权利要求8所述的题目录入方法,其特征在于:

所述步骤S5包括,

S51,将所述题目文本转化为纯文本格式,并做分词处理;

S52,根据各分词,在预先构建的题型索引词库中检索出若干个与所述分词相似的候选题型描述信息;

S53,基于预设的过滤策略,从候选题型描述信息中确定出所述题型描述特征。

10.根据权利要求9所述的题目录入方法,其特征在于:

所述题型索引词库的构建方法包括:

从大量试卷数据中提取纯文本化的题型描述样本;

对所述题型描述样本进行分词;

将全部分词在领域词典中进行甄别,获取其中属于题型描述信息的目标分词;

其中所述题型描述信息包括题型学科、题型名称以及题型备注;

由所述目标分词构建出所述题型索引词库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东国粒教育技术有限公司,未经广东国粒教育技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110122288.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top