[发明专利]一种基于条件密度估计模型的成绩分布预测方法及系统在审
申请号: | 202211026487.1 | 申请日: | 2022-08-25 |
公开(公告)号: | CN115409257A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 张娜;刘明 | 申请(专利权)人: | 济南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N20/00;G06Q50/20 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 于凤洋 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 条件 密度 估计 模型 成绩 分布 预测 方法 系统 | ||
本发明提出了一种基于条件密度估计模型的成绩分布预测方法及系统,涉及数据挖掘领域,用于解决现有成绩预测方案局限性大、准确率低的问题,该方法包括:根据预测目标,采集学生数据,存储到第一服务器的数据库中;对数据库中存储的学生数据进行预处理,剔除缺失严重或特征值分布异常的特征,并用条件掩码机制进行特征融合,得到数据集;构建条件密度估计模型,并利用数据集进行训练;将待预测的学生数据输入到训练好的条件密度估计模型中,得到预测目标的成绩概率密度分布;本发明利用条件密度估计模型,构建统一技术框架,以任意数据为输入条件,预测出未来课程/考试成绩的完整概率密度分布,实现任意教育场景下成绩的准确预测。
技术领域
本发明属于数据挖掘领域,尤其涉及一种基于条件密度估计模型的成绩分布预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
目前,学生成绩预测是进行学习分析的重要目标;在信息建设推动下,各大高校已经着手建设数字化校园或智慧校园,并取得良好效果;然而,智慧校园建设更多地聚焦在高校,仅有部分学校开始推动数字化教育;目前,在现有预测方案,存在如下问题:(1)现有的成绩预测只针对一类群体,例如只针对大学生课程的成绩预测,尚未形成小学、初中、高中、大学各教育阶段都适用的统一框架;(2)考虑到的影响学生成绩的因素较少,忽略了学生自身特征、课余活动以及教师等因素对成绩的影响;(3)无法将收集到的信息完整的融合,例如现有发明无法将专业不同导致修课不同的学生样本进行完整融合;(4)只能预测学生成绩或判断学生是否顺利通过考试,无法预测学生整体的成绩分布导致预测信息并不完备。因此,现有成绩预测方案存在局限性大、准确率低的问题,需要进一步的研究。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于条件密度估计模型的成绩分布预测方法及系统,利用条件密度估计模型,构建统一技术框架,以任意数据为输入条件,预测出未来课程/考试成绩的完整概率密度分布,实现任意教育场景下成绩的准确预测。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
本发明第一方面提供了一种基于条件密度估计模型的成绩分布预测方法;
一种基于条件密度估计模型的成绩分布预测方法,包括:
根据预测目标,采集学生数据,存储到第一服务器的数据库中,对数据库中存储的学生数据进行筛选,得到属性特征;
对数据库中存储的学生数据进行预处理,剔除缺失严重或特征值分布异常的特征,并用条件掩码机制进行特征融合,得到数据集;
构建条件密度估计模型,并利用数据集进行训练;
将待预测的学生数据输入到训练好的条件密度估计模型中,得到预测目标的成绩概率密度分布。
进一步的,所述预测目标,包括单门课程成绩、中考成绩、高考成绩、考研成绩、培训机构毕业成绩;
学生数据,包括学生基本信息、学生课程相关数据、教师课程相关数据及学生行为数据,其中,其他信息,包括图书馆进出记录、图书借阅次数、获奖情况;
进一步的,从学校的教务系统、数字化校园、智慧校园中通过数据接口或者爬虫抓取的方式采集数据,并存储在第一服务器的数据库中。
进一步的,所述特征融合采用条件掩码机制,尤其针对特征不同导致无法统一建模的弊端,引入掩码mask机制,通过将mask与特征关联,标识出元素的缺失。
进一步的,所述条件密度估计模型,通过参数化或非参数化方法根据输入条件拟合预测目标的分布,分布拟合过程中,采用似然估计来优化分布误差。
进一步的,根据年级,将数据集划分为训练集、验证集和测试集,分别用于条件密度估计模型的学习、检验和测试;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211026487.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卷绕式正极片和二次电池
- 下一篇:一种多信道用户接入方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理