[发明专利]一种基于支持向量机和最大互相关熵的成绩预测方法在审
申请号: | 201910232831.4 | 申请日: | 2019-03-26 |
公开(公告)号: | CN110059729A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 杜少毅;张思睿;宋盼盼;万腾;崔文婷;许光林 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/20 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互相关 支持向量机 心理测验 样本集 预测 成绩 样本 支持向量机分类器 筛选 多元回归分析 多元线性回归 考试成绩 人格因素 因子数据 预测模型 大学生 分类器 鲁棒性 特征集 细粒度 过滤 标签 英语 回归 | ||
1.一种基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,包括以下步骤:
步骤1:首先对用户进行卡特尔16PF心理测验,得到用户的16PF数据作为数据特征集X,再获取到用户同年的考试成绩作为数据标签Y;量化数据特征集X中每个特征的数值,使特征的数值分布在[1,10];
步骤2:计算每个特征的信息增益以及每个特征与标签的Pearson相关系数,对特征的信息增益和相关系数分别从大到小排序;
步骤3:对步骤2获得的所有信息增益和相关系数通过百分比阈值p进行筛选;把信息增益和Pearson相关系数处于前p的特征并入特征子集,否则就舍弃该特征,对得到的特征子集采用包裹式特征筛选法选出效果最好的特征子集;
步骤4:将数据标签Y按照是否合格量化为-1或1,建立支持向量机分类器对训练集进行分类,将样本分为考试成绩合格和不合格两类;
步骤5:对步骤4得到的成绩合格的训练样本进行基于互相关熵的多元回归训练,根据测试样本的评估结果得到成绩预测模型。
2.根据权利要求1所述的基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,所述步骤2的具体方法如下:
步骤2.1:计算每个特征的信息增益
设训练样本集为D,|D|表示样本个数;设有K个类Ck,k=1,2,3,…,K,|Ck|为属于类Ck的样本个数,设特征A有n个子集D1,D2,…,Dn,|Di|为Di的样本个数,记子集Di中属于类Ck的样本的集合为Dik,即Dik=Di∩Ck,|Dik|为Dik的样本个数;信息增益的公式如下:
g(D,A)=H(D)-H(D|A)
步骤2.2:计算人格因子与对应成绩的Pearson相关系数
给定两随机变量X和Y,假设样本容量为n,样本相关系数rxy表示如下:
其中,为x和y的协方差,为x的标准差;|r|表明两变量间的相关程度,r>0表示正相关,r<0表示负相关,r=0表示零相关;
步骤2.3:对信息增益和Pearson相关系数降序排列。
3.根据权利要求1所述的基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,步骤3的具体方法如下:
步骤3.1:对排序后的信息增益和Pearson相关系数根据百分比筛选有效的特征,并舍弃贡献较少的特征;
假设用于筛选的百分比为p,因素个数为k,单个因素与成绩的相关系数为rl,l=1,2,…,k,筛选到的自变量个数为:
其中为上取整;
步骤3.2:依据百分比筛选原则,选取信息增益和Pearson相关系数处于前N的特征并入特征子集;
步骤3.3:使用包裹式特征筛选法选出最终的有效特征子集。
4.根据权利要求3所述的基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,步骤5的具体方法如下:
步骤5.1:将步骤4得到的及格样本集按照7:3分为训练数据样本和测试数据样本;
步骤5.2:对训练样本进行基于最大互相关熵的多元线性回归训练,建立多元线性回归模型为:
y=a0+a1x1+a2x2+…+akxk
对于模型学习而言,模型求解就是根据训练样本估计参数a0,a1,a2,…,ak;最大化基于互相关熵定义的目标函数,使用梯度下降法求取回归模型系数:
步骤5.3:在测试样本集上判断当前的预测均差是否已经符合要求,若已符合要求,则输出回归模型系数a,若预测误差尚未符合要求,则继续判断当前的迭代次数t是否已经达到预设的迭代最大值,若已经达到,则输出回归模型系数a,若尚未达到,则返回步骤3.3,继续迭代求解最优解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910232831.4/1.html,转载请声明来源钻瓜专利网。