[发明专利]一种基于教育数据挖掘的学生成绩早期预警方法及系统有效
申请号: | 201810917660.4 | 申请日: | 2018-08-13 |
公开(公告)号: | CN109242149B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 杜旭;杨宗凯;杨娟;张明焱 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/20 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 教育 数据 挖掘 学生 成绩 早期 预警 方法 系统 | ||
1.一种基于教育数据挖掘的学生成绩早期预警方法,其特征在于,所述基于教育数据挖掘的学生成绩早期预警方法利用从在线学习平台采集的学习行为数据以及从教务管理系统采集的学生的基本统计数据和成绩数据;
再基于多层感知机multilayer perceptron算法和基于信息增益率的C4.5决策树算法,构建两阶段的预测模型;
再形成最终的学习成绩的早期预警模型;
其中第一阶段分别构建success预测模型和fail预测模型;第一阶段的success模型输出的学生考试通过概率、fail模型输出的学生考试失败概率以及根据两者的和生成的衍生变量,均用于第二阶段预测模型的构建;
所述基于教育数据挖掘的学生成绩早期预警方法具体包括:
步骤一:数据获取:
在数据获取的阶段,需要根据特定的在线学习平台对学习行为数据的记录特性,选取某一范围内学生的学习行为数据,并从教务管理系统中获取相应的这些学生的基本统计数据和成绩数据;
第一阶段的success模型和fail模型是根据不同的在线学习平台所能够收集的学习行为特征作为输入特征,收集某一门课程的学习者在多个在线学习平台上的学习行为特征作为模型输入,该门课程的期末考试成绩为模型的输出,模型在训练过程中,利用神经网络的前向传播过程所得的预测值,得到预测值和真实值的损失值,并利用随机梯度下降算法,将参数的梯度更新量迅速地反向传播用于更新参数,多次迭代直至目标优化函数达到最优,进行预测模型的参数训练;
第一阶段预测模型都训练完成后,分别得到success模型对学生考试通过的预测概率值,记为Ps;以及fail模型对学生考试失败的预测概率值,记为Pr;
步骤二:数据预处理:
进行数据清洗、类别型变量的处理、数值型变量的处理及成绩信息的处理;
所述数据清洗:删除原始数据集中的无关数据或重复数据,并处理缺失数据;
所述类别型变量的处理:先对取值较多的类别型变量进行一定规则的类别压缩,再进行独热编码;
所述数值型变量的处理:采用最大-最小规范化处理,将数据映射到[0,1]之间;
或采用零均值规范化处理,使处理后的数据满足均值为0,标准差为1的分布;
所述成绩信息的处理:根据真实的成绩信息,再按照特定教育情境下考试是否通过的规则定义,将成绩映射为通过类别和失败类别;
步骤三:数据集的划分:
根据交叉验证的思想对预处理后的数据集进行划分,同时在划分时基于成绩字段的少数类别取值进行分层抽样,形成训练集和验证集,分别用于各个阶段的预测模型的训练和预测效果验证;
步骤四:第一阶段的预测模型:
基于多层感知机算法构建success预测模型和fail预测模型,根据训练好的两个模型相应得到样本集中所有学生考试会通过的概率和会失败的概率,分别得到success模型对学生考试通过的预测概率值,记为Ps;以及fail模型对学生考试失败的预测概率值,记为Pr;
步骤五:第二阶段的预测模型:
基于前一阶段的success预测模型和fail预测模型的各自输出预测概率值Ps和Pr,以及Psum作为每一个样本新的输入特征,真实的期末考试成绩所得的fail标记信息为输出特征,再基于C4.5决策树分别计算这3个输入属性的信息增益率,选择信息增益率最高的属性作为最佳的决策树划分属性,从而构建第二阶段的学生成绩预测模型;
步骤六:结果预测:
通过两阶段的预测模型的构建以及各自在验证集上的评估结果的定量分析;对新样本进行和训练/验证数据一样的预处理操作;然后将预处理后的数据送到已训练好的两阶段的成绩预警模型中,最终得到对该样本的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810917660.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置