[发明专利]基于机器智能的题库生产方法及系统在审
申请号: | 201911042467.1 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110781672A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 周云;须佶成;李川;刘岩;雷光化;任悦超 | 申请(专利权)人: | 北京爱学习博乐教育科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/253;G06F40/126;G06F40/103;G06K9/00;G06N3/04 |
代理公司: | 11303 北京方韬法业专利代理事务所(普通合伙) | 代理人: | 党小林 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 题库 层次结构 基于机器 试卷 图像文件转换 自动识别技术 还原技术 人工成本 智能 知识点 试题 自动化 生产 | ||
本发明提供了一种基于机器智能的题库生产方法及系统。所述方法包括:通过版本还原技术,将试卷的图像文件转换为word文件;通过自动识别技术,由所述word文件中识别出所述试卷中试题的层次结构;通过BERT模型,提取所述层次结构中蕴含的知识点。本发明提供的基于机器智能的题库生产方法及系统大幅提高了题库生产线的效率,降低了人工成本,提高了自动化规模。
技术领域
本发明涉及人工智能技术领域,特别是涉及一种基于机器智能的题库生产方法及系统。
背景技术
在在线教育企业,教研老师们生产题目的过程中,基本都是依靠人工录入题目。人工录入题目需要教研老师对不同渠道得到的试卷,题目照片,文档等通过系统进行录入。每到生产季,需要大量的教研人员来进行题目的录入工作。导致每道题目的录入人力成本很高,同时存在录入失误的情况。为了降低人为录入失误的风险,还需要投入人力对题目进行逐道审核。题目录入的方式与可靠性,对教育企业的生产成本和生产时间有着较大的影响。
设计一套可以自动化识别图片,文档并且可以智能录题的系统,是在线教育企业的必然需求。
目前的采用word插件的形式提供了两种处理方式:第一种是使用word作为编辑器为网页提供富文本编辑,这种方式类似常见的富文本网页编辑器,如文本,图像,公式等需要逐个剪贴,细粒度的操作频次很高,并且会导致学科大量的知识资产以word的形式存放;第二种是批量导入试题功能,需要人工按照规定的格式准备好文档,再进行试题的导入。
这两种处理方式在人工录入的基础上有了一定的优化,可以提高教研人员试题录入的效率,相对降低录题的人工成本,可以基本满足目前的需求。
目前处理方式在原始人工录题的基础上有了一定的优化,但是也存在着不少的问题。
首先,word插件的运行环境为windows+word2016+mathtype,软件对环境的要求比较高,同时也无法支持很多使用WPS的用户,以及非Windows的PC如OSX系统。其次,对于单题录入的富文本编辑器来说,文本,图像,公式都需要逐个剪贴,细颗粒度的操作频次很高,操作繁琐。最后,对于批量导入试题的功能,还是需要人工预先将文档打好标签,不能脱离人工的操作。
发明内容
本发明要解决的技术问题是提供一种基于机器智能的题库生产方法及系统,从而大幅提高了题库生产线的效率,降低了人工成本,提高了自动化规模。
为解决上述技术问题,本发明提供了一种基于机器智能的题库生产方法,所述方法包括:通过版本还原技术,将试卷的图像文件转换为word文件;通过自动识别技术,由所述word文件中识别出所述试卷中试题的层次结构;通过BERT模型,提取所述层次结构中蕴含的知识点。
在一些实施方式中,通过版本还原技术,将试卷的图像文件转换为word文件,包括:对所述图像文件进行预处理;对预处理后的图像文件进行检测、识别;对检测、识别得到的结果进行后处理。
在一些实施方式中,所述预处理包括:双栏分割、旋转校正、大小调整。
在一些实施方式中,对检测、识别得到的结果进行后处理,包括:根据检测的坐标信息合并识别的文本、Latex公式及图表。
在一些实施方式中,通过自动识别技术,由所述word文件中识别出所述试卷中试题的层次结构,包括:将word文档转换为T语言文件;将T语言文件输入至Antlr解析模块,获得语法树,所述语法树表示试卷中试题的层次结构;通过遍历语法树,获得试题集的业务对象json数据结构。
在一些实施方式中,所述BERT模型包括:双向Transformer的编码器。
在一些实施方式中,所述双向Transformer的编码器包括:多头注意力机制层,以及前馈网络层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱学习博乐教育科技有限公司,未经北京爱学习博乐教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911042467.1/2.html,转载请声明来源钻瓜专利网。