[发明专利]一种试题自动标注录入方法在审
申请号: | 202010032609.2 | 申请日: | 2020-01-13 |
公开(公告)号: | CN111209728A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 杨立春;夏德虎;张志发;赵梦凯;巩稼民;蒋杰伟;张凯泽;杨红蕊;马豆豆;刘爱萍 | 申请(专利权)人: | 深圳市企鹅网络科技有限公司;西安邮电大学 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F40/151;G06F40/284 |
代理公司: | 广州润禾知识产权代理事务所(普通合伙) 44446 | 代理人: | 林伟斌;欧秋望 |
地址: | 518000 广东省深圳市南山区西丽街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 试题 自动 标注 录入 方法 | ||
1.一种试题自动标注录入方法,其特征在于,包括:
S1.接收word试题文档,将word试题文档自动转换成对应的html文档并存储所述html文档;
S2.自动提取html文档的文本内容;
S3.对所述提取的文本内容进行词语分割及对分割后的词语进行词性标注并标注词语在文本中的位置;
S4.对所述标注好词性的词语进行试题特征提取,判断所述词语的特征是否与预设的试题关键字的特征对应,是则对所述词语进行关键字标注,将标注为关键字的词语作为确定的关键字;
S5.根据确定的关键字对试题进行逐题分割,并存储每道试题的关键字;
S6.根据逐题分割好的关键字及所述关键字在文本中的位置在试题构造模块中对试题进行组装,并根据关键字及所述关键字在文本中的位置将组装好的试题存储到对应的位置。
2.根据权利要求1所述的一种试题自动标注录入方法,其特征在于,所述步骤S1中将word试题文档自动转换成对应的html文档的同时还包括将文档内的公式转换成图片并记录所述图片在文档中对应的位置标签,将所述图片及其对应的位置标签与html文档存储在同一个文件夹中。
3.根据权利要求2所述的一种试题自动标注录入方法,其特征在于,所述步骤S2中还包括提取所述图片的位置标签并在文本中标记图片的对应位置。
4.根据权利要求1所述的一种试题自动标注录入方法,其特征在于,所述步骤S4中判断所述词语的特征是否与预设的试题关键字的特征对应具体为采用多层正则表达式对所述词语进行试题特征提取,判断所述词语是否与预设的试题关键字特征对应,是则对所述词语进行关键字标注,将标注为关键字的词语作为确定的关键字。
5.根据权利要求4所述的一种试题自动标注录入方法,其特征在于,所述步骤S4中还包括对所述标注为关键字的词语进行二次筛选。
6.根据权利要求1所述的一种试题自动标注录入方法,其特征在于,所述确定的关键字包括题号、选项、答案和解析其中的一个或多个。
7.根据权利要求6所述的一种试题自动标注录入方法,其特征在于,所述步骤S6中根据确定的关键字对试题进行逐题分割具体为以题号关键字为判断依据,若两个题号关键字之间包含了答案关键字和/或解析关键字,则对试题进行分割;若一个题号关键字和下一个题号关键字之间没有答案关键字和/或解析关键字则将下一个题号关键字标记为干扰。
8.根据权利要求5所述的一种试题自动标注录入方法,其特征在于,对所述标注的关键字进行二次筛选具体为将单个试题中所有关键字通过随机变异算法进行关键字组合并计算所有关键字组合的分值,选取分值最高的组合的关键字作为确定的关键字。
9.根据权利要求1或8所述的一种试题自动标注录入方法,其特征在于,所述步骤S6还包括将确定的关键字在不同类型的试题构造模块中进行试题组装,并计算组装之后的试题在不同类型的试题构造模块中的分值,对同一试题在不同类型的试题构造模块中的分值进行比较,将分值最高的试题构造模块的类型作为所述试题的类型,并对所述试题的类型进行标注。
10.根据权利要求2所述的一种试题自动标注录入方法,其特征在于,所述步骤S6还包括查找试题中的图片的位置标签,将试题中包含的图片存储到对应位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市企鹅网络科技有限公司;西安邮电大学,未经深圳市企鹅网络科技有限公司;西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010032609.2/1.html,转载请声明来源钻瓜专利网。