[发明专利]一种基于行为时序权重的分布式FP-Growth成绩预警模型有效
申请号: | 202011337949.2 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112668750B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 陈伟宁 | 申请(专利权)人: | 紫光云技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/20;G06F18/26 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 刘莹 |
地址: | 300459 天津市滨海新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 行为 时序 权重 分布式 fp growth 成绩 预警 模型 | ||
本发明提供了一种基于行为时序权重的分布式FP‑Growth成绩预警模型,包括:使用关联规则挖掘成绩信息方法,用于将学生在网络上行为特征进行分类,结合不同时间段以及学生信息生成学生样本数据;使用行为时序权重提高预测准确度,用于对于任意未知学生,提取其行为数据和附加属性,与上述强关联规则进行对比,然后得出其成绩的预测概率;使用分布式架构提高挖掘速度。本发明所述的一种基于行为时序权重的分布式FP‑Growth成绩预警模型应用FP‑Growth挖掘高校学生日常网络行为的关联性,从而探索学生成绩与其网络行为之间的联系,以此来对学生成绩作出预测;使用行为时序参数提高预测的准确度,并使用Spark分布式架构提高整体挖掘速度。
技术领域
本发明属于信息化数字化教学领域,尤其是涉及一种基于行为时序权重的分布式FP-Growth成绩预警模型。
背景技术
成绩预测一直是高校学生工作中的重点,目前通常被采取的办法是通过学生的历史成绩、平时成绩以及出勤率等较为直观的方法,暂无其他方法的广泛应用,此问题成为了亟待解决的校园问题。传统方法中使用学生平时成绩以及出勤率等较为直观的数据进行预测的做法往往不具有足够的说服力和准确度,这在很大程度上是因为上述表面性数据仅能代表学生的表面特征,而学生的日常行为则与成绩存在更大的关联性,其中网络行为占据主导地位,但这些数据通常是无法获取的。此外,部分成绩良好甚至优秀的学生会突然出现成绩大幅度下滑的现象,这与其网络行为更是关系紧密,传统方法也无法及时发觉。
发明内容
有鉴于此,本发明旨在提出一种基于行为时序权重的分布式FP-Growth成绩预警模型,以解决上述问题的不足之处。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于行为时序权重的分布式FP-Growth成绩预警模型,包括:
使用关联规则挖掘成绩信息方法,用于将学生在网络上行为特征进行分类,结合不同时间段以及学生信息生成学生样本数据;
使用行为时序权重提高预测准确度,用于对于任意未知学生,提取其行为数据和附加属性,与上述强关联规则进行对比,然后得出其成绩的预测概率;
使用分布式架构提高挖掘速度。
进一步的,所述使用关联规则挖掘成绩信息方法包括:
数据选择:首先将学生在网络上行为特征进行分类,选取学生样本作为数据源,在对行为特征进行类别划分时,对出现过的行为类别进行编号;
进行时间段划分:以天为单位将时间分为具有代表性的多段,统计不同时段的各种行为的出现情况;
将包括学生信息、时间段、行为类别和成绩信息的数据使用编号表示,依次统计全部学生的上述信息,形成多个包括学生数据的编号,即为获取了全部样本学生的数据。
进一步的,在选择学生数据时,选择成绩偏向两极的学生作为数据源。
进一步的,在获取全部样本数据后,依照频繁项挖掘规则,设置初始的最小支持度Supmin,使用FP-Growth算法挖掘上述每一张表每一个时段的频繁项。
进一步的,使用行为时序权重提高预测准确度包括:
提取任一学生的所有组行为及属性数据,依据最小支持度Supmin挖掘其全部频繁项,并将其中的成绩项隐去,
将每一组频繁项与已得出的强关联规则中的数据进行对比匹配,优先匹配其中Kulc参数较高者;
计算得出该未知学生的成绩优秀预测概率和成绩预警预测概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于紫光云技术有限公司,未经紫光云技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011337949.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理