[发明专利]一种大数据基础算法学习自动评价方法及系统在审
申请号: | 202010900962.8 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112102124A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 海克洪;郭梁;胡新海 | 申请(专利权)人: | 湖北美和易思教育科技有限公司 |
主分类号: | G06Q50/20 | 分类号: | G06Q50/20;G06F8/41;G06F11/36 |
代理公司: | 武汉红观专利代理事务所(普通合伙) 42247 | 代理人: | 李季 |
地址: | 430000 湖北省武汉市东湖新技术开发区北斗路6号武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 基础 算法 学习 自动 评价 方法 系统 | ||
本发明公开一种大数据基础算法学习自动评价方法及系统,所述方法包括:提取基础算法的关键步骤,进行特征提取组成每个基础算法的标准特征矩阵;对于每个基础算法,获取多个不同实现方式的源代码,按块划分得到基本代码块,建立特征矩阵中的特征向量与每个源代码的基本代码块之间的对应关系;获取学生提交的基础算法作业代码,编译运行,若编译成功,进行测试,输出测试结果,根据测试结果进行评分;若编译失败,将作业代码按块划分,得到作业代码块,根据作业代码块计算作业特征矩阵;计算所述作业特征矩阵与标准特征矩阵之间的相似度,根据所述相似度进行评分。本发明可对学生编写的基础算法进行自动评价并自动定位问题区域。
技术领域
本发明涉及在线教育技术领域,具体涉及一种大数据基础算法学习自动评价方法及系统。
背景技术
在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。国际权威的学术组织ICDM曾经评选出了数据挖掘领域的十大经典算法:C4.5,k-Means,SVM,Apriori,EM,PageRank,AdaBoost,kNN,Naive Bayes,and CART。这些经典算法是大数据的基础算法,这些算法的原理已经非常清楚,一些开源的代码也很好的实现了这些算法的程序,但是对于学生而言,理解算法原理、对这些基础算法进行编写、运行、应用是学生大数据学习的重要部分。在线教育中,对于学生编写的基础算法,常规的评价方式是通过教师人工评判的方式进行,最主要的评分依据是程序运行结果的正确性,对于编译失败的程序,评分标准主观性强,缺乏公正性,且无法有效定位问题代码区域。
发明内容
有鉴于此,本发明提出了一种大数据基础算法学习自动评价方法及系统,用于无法解决学生编写的基础算法的有效进行自动评价、无法自动定位问题区域的问题。
本发明第一方面,提出一种大数据基础算法学习自动评价方法,所述方法包括:
提取大数据基础算法的关键步骤,对每个关键步骤进行特征提取组成特征向量,根据每个关键步骤的特征向量组成每个基础算法的标准特征矩阵;
对于每个基础算法,获取多个不同实现方式的源代码,将源代码按块划分,得到基本代码块,建立特征矩阵中的特征向量与每个源代码的基本代码块之间的对应关系;
获取学生提交的基础算法作业代码,编译运行,若编译成功,进行测试,输出测试结果,根据测试结果进行评分;
若编译失败,将作业代码按块划分,得到作业代码块,根据所述作业代码块计算所述作业代码的作业特征矩阵;计算所述作业特征矩阵与标准特征矩阵之间的相似度,根据所述相似度进行基础算法学习评分。
优选的,所述基础算法的关键步骤通过自然语言或伪代码的形式表示。
优选的,将每个关键步骤进行特征提取组成特征向量具体为:
采用TF-IDF方法提取关键词并计算权重,建立每个关键步骤的向量空间模型。
优选的,所述特征向量与每个源代码的基本代码块之间的对应关系为一对一或一对多
优选的,所述根据所述作业代码块计算所述作业代码的作业特征矩阵具体为:计算每个作业代码块与每个源代码的基本代码块之间的语义相似度;
对于语义相似度超过设定阈值的作业代码块和基本代码块,从所述标准特征矩阵中获取与所述基本代码块对应的特征向量,对于语义相似度小于等于设定阈值的作业代码块,用零向量表示,得到每个作业代码块对应的特征向量;将每个作业代码块对应的特征向量组成作业特征矩阵。
本发明第二方面,公开一种大数据基础算法学习自动评价系统,所述系统包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北美和易思教育科技有限公司,未经湖北美和易思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010900962.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置