[发明专利]一种基于支持向量机和最大互相关熵的成绩预测方法在审
申请号: | 201910232831.4 | 申请日: | 2019-03-26 |
公开(公告)号: | CN110059729A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 杜少毅;张思睿;宋盼盼;万腾;崔文婷;许光林 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/20 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互相关 支持向量机 心理测验 样本集 预测 成绩 样本 支持向量机分类器 筛选 多元回归分析 多元线性回归 考试成绩 人格因素 因子数据 预测模型 大学生 分类器 鲁棒性 特征集 细粒度 过滤 标签 英语 回归 | ||
本发明公开了一种基于支持向量机和最大互相关熵的成绩预测方法,通过对用户进行卡特尔16PF心理测验,获取用户的人格因子数据作为样本特征集,同年获取到其全国大学生英语四级(CET‑4)考试成绩作为样本标签;然后在样本集上使用本发明中提出的基于支持向量机和最大互相关熵回归的人格因素对CET‑4成绩预测方法。该方法首先建立支持向量机分类器对样本集进行细粒度的划分,然后在分类器过滤后的样本集上采用基于最大互相关熵的多元线性回归的方法建立预测模型。本发明通过大学生卡特尔16PF心理测验可完成对其同年CET‑4成绩的预测,并且本发明对于卡特尔心理测验中产生的误差、Pearson相关系数强筛选人格因子、多元回归分析弱筛选人格因子等情况有着很好的鲁棒性和准确性。
【技术领域】
本发明属于机器学习应用于心理学和教育领域,涉及一种基于支持向量机和 最大互相关熵的成绩预测方法。
【背景技术】
在心理语言学领域中,一个人的语言天赋和其人格因素息息相关,Blick G,Leino J等的研究表明人格因素对学习有一定的影响,包括人格特征在内的非智力 因素水平的高低是造成成绩优劣的主要原因。因此,研究建立人格因素与英语成 绩的预测算法,根据全面的人格因素分析制定学生的综合培养方案,克服人格因 素缺失的部分,提升其自身素质和竞争力,从而提高就业能力,会对中国学生英 语教育产生极大的良性推动。
通过对被测者进行卡特尔16PF测验,得出其相对权威的24种人格因素,从 而建立人格因素与英语成绩的回归预测模型。目前基于多元线性回归的英语成绩 预测模型的研究主要采用两种选取训练样本自变量的方法,一种是分别计算每种 人格因素与总成绩之间的Pearson相关系数,选出显著相关的人格因素作为自变 量集;另一种是把测试到的所有人格因素都作为自变量;然后,建立训练自变量 与总成绩的回归预测模型。前者筛选太严格,把弱相关的人格因素都排除在外, 只保留显著相关因素,忽略了弱相关人格因素联合时可能产生强相关的效果;后 者则是保留了全部因素,也包括极弱相关和不相关的人格因素,从而引入了噪声, 使得预测误差变大。
【发明内容】
本发明的目的在于克服上述现有技术的缺点,提供一种基于支持向量机和最 大互相关熵的成绩预测方法。
为达到上述目的,本发明采用以下技术方案予以实现:
一种基于支持向量机和最大互相关熵的成绩预测方法,包括以下步骤:
步骤1:首先对用户进行卡特尔16PF心理测验,得到用户的16PF数据作为 数据特征集X,再获取到用户同年的考试成绩作为数据标签Y;量化数据特征集 X中每个特征的数值,使特征的数值分布在[1,10];
步骤2:计算每个特征的信息增益以及每个特征与标签的Pearson相关系数, 对特征的信息增益和相关系数分别从大到小排序;
步骤3:对步骤2获得的所有信息增益和相关系数通过百分比阈值p进行筛 选;把信息增益和Pearson相关系数处于前p的特征并入特征子集,否则就舍弃 该特征,对得到的特征子集采用包裹式特征筛选法选出效果最好的特征子集;
步骤4:将数据标签Y按照是否合格量化为-1或1,建立支持向量机分类器 对训练集进行分类,将样本分为考试成绩合格和不合格两类;
步骤5:对步骤4得到的成绩合格的训练样本进行基于互相关熵的多元回归 训练,根据测试样本的评估结果得到成绩预测模型。
本发明进一步的改进在于:
所述步骤2的具体方法如下:
步骤2.1:计算每个特征的信息增益
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910232831.4/2.html,转载请声明来源钻瓜专利网。