[发明专利]基于半监督学习的大规模网络开放课程退课预测算法在审
申请号: | 201510967503.0 | 申请日: | 2015-12-21 |
公开(公告)号: | CN105631536A | 公开(公告)日: | 2016-06-01 |
发明(设计)人: | 江峰;李文涛 | 申请(专利权)人: | 重庆工商职业学院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/20;G06K9/62 |
代理公司: | 重庆信航知识产权代理有限公司 50218 | 代理人: | 穆祥维 |
地址: | 400052 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 大规模 网络 开放 课程 预测 算法 | ||
技术领域
本发明涉及计算机与信息技术,具体涉及一种基于半监督学习的大规模 网络开放课程退课预测算法。
背景技术
Web2.0及云计算等技术的成熟给教育信息化提供了新的契机,大型在线 公开课程(MOOC,又称慕课)便是互联网应用创新的产物。随着edx、coursera 及udacity等MOOC网站的兴起以及MIT,Stanford等大学相继在MOOC平 台开设课程,MOOC受到了越来越多的关注与认同。MOOC依托互联网,为 大量的学生提供教育诸如答题,考试,看视频等教育体验,并能够让学生利 用网络论坛等形式协同学习。并且MOOC具备的开放性特点,使得MOOC 为不同学习背景的学生提供学习机会。
尽管MOOC与传统教育相比拥有其独特的优点,但是MOOC的学习者 群体具有较大的差异性。这种差异性主要体现在教育背景与教育动机上,如 有的学生仅仅为了获取某一个知识点而注册某门课程,并且由于退出MOOC 课程的代价较低,这就导致学习者的退课率过高。许多教育者指出MOOC的 高退课率是一种普遍的现象,如果不及时采取对应措施将导致MOOC平台的 发展受到限制。
对学生退出因素的分析不仅可以帮助MOOC改进平台的建设,而且可以 通过一些,提高学生的留存率,从而保证课程的有序进行。因此,通过建立 模型对学生的退课行为进行预测可以帮助MOOC达到更好的教学效果。 MOOC退课预测的价值短期价值:通过判定一个用户是否退课,可以辅助教 师或者系统对可能退课的用户进行干预,降低他们退课可能。长期价值:分 析课程性质与退课率的关系,设计出退课率较低的课程,提高MOOC课程的 质量。
现有的预测算法主要有两种,一种是对学生的一些行为进行跟踪,如果 对学生作业查询行为、视频观看行为、其他资源获取行为等进行跟踪,统计 这些行为出现的次数,从而判断预测学生是退课或存留。这种预测算法存在 如下缺陷:首先,使用监督型学习,在大量标注样本集上训练一个模型,但 是样本标签的获取代价非常大这主要体现在:第一样本数量大,第二样本标注 需要花费非常多的人力和时间,并且标记样本需要专业人员进行;其次,该 预测算法使用的特征是一种概括性特征,无法对退课学生进行准确刻画,因 此,预测准确性较低。另一种预测算方法是根据每周的退课率来推算该门课 程的最终退课率,这种预测方法虽然能预测某一门课的退课率,但是无法针 对具体的学生或用户进行判断,即无法判断是哪些学生或用户退课。
发明内容
针对现有技术存在的上述问题,本发明的目的是一种可以准确判断某个 用户退课或存留大规模网络开放课程退课预测算法。
为实现上述目的,本发明采用如下技术方案:基于半监督学习的大规模 网络开放课程退课预测算法,包括如下步骤:
S1:从MOOC网站获取用户的学习日志文件,获取的用户一部分构成测 试样本集,另一部分构成训练样本集,其中测试样本集中的测试样本全部是 已标记样本,该训练样本集中包括未标记样本和已标记样本,所有未标记样 本构成未标记样本集,所有已标记样本构成标记样本集;
S2:根据用户的学习日志文件统计训练样本集中所有样本的行为特征, 得到最能表达训练样本集中所有样本共有特性的n种行为特征;
设某一课程的课程持续时间为K周;
设Ui={U(i,1),...,U(i,j),...,U(i,n)},Ui表示训练样本集中的第i个样本, U(i,j)={(U(i,j)1,...,U(i,j)k,...,U(i,j)K)},U(i,j)表示训练样本集中第i个 样本的第j种行为特征向量,U(i,j)k表示第i个用户的第j种行为特征在课程 持续时间的第k周出现的次数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆工商职业学院,未经重庆工商职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510967503.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理