[发明专利]一种基于支持向量机和最大互相关熵的成绩预测方法在审

专利信息
申请号: 201910232831.4 申请日: 2019-03-26
公开(公告)号: CN110059729A 公开(公告)日: 2019-07-26
发明(设计)人: 杜少毅;张思睿;宋盼盼;万腾;崔文婷;许光林 申请(专利权)人: 西安交通大学
主分类号: G06K9/62 分类号: G06K9/62;G06Q50/20
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 徐文权
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 互相关 支持向量机 心理测验 样本集 预测 成绩 样本 支持向量机分类器 筛选 多元回归分析 多元线性回归 考试成绩 人格因素 因子数据 预测模型 大学生 分类器 鲁棒性 特征集 细粒度 过滤 标签 英语 回归
【权利要求书】:

1.一种基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,包括以下步骤:

步骤1:首先对用户进行卡特尔16PF心理测验,得到用户的16PF数据作为数据特征集X,再获取到用户同年的考试成绩作为数据标签Y;量化数据特征集X中每个特征的数值,使特征的数值分布在[1,10];

步骤2:计算每个特征的信息增益以及每个特征与标签的Pearson相关系数,对特征的信息增益和相关系数分别从大到小排序;

步骤3:对步骤2获得的所有信息增益和相关系数通过百分比阈值p进行筛选;把信息增益和Pearson相关系数处于前p的特征并入特征子集,否则就舍弃该特征,对得到的特征子集采用包裹式特征筛选法选出效果最好的特征子集;

步骤4:将数据标签Y按照是否合格量化为-1或1,建立支持向量机分类器对训练集进行分类,将样本分为考试成绩合格和不合格两类;

步骤5:对步骤4得到的成绩合格的训练样本进行基于互相关熵的多元回归训练,根据测试样本的评估结果得到成绩预测模型。

2.根据权利要求1所述的基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,所述步骤2的具体方法如下:

步骤2.1:计算每个特征的信息增益

设训练样本集为D,|D|表示样本个数;设有K个类Ck,k=1,2,3,…,K,|Ck|为属于类Ck的样本个数,设特征A有n个子集D1,D2,…,Dn,|Di|为Di的样本个数,记子集Di中属于类Ck的样本的集合为Dik,即Dik=Di∩Ck,|Dik|为Dik的样本个数;信息增益的公式如下:

g(D,A)=H(D)-H(D|A)

步骤2.2:计算人格因子与对应成绩的Pearson相关系数

给定两随机变量X和Y,假设样本容量为n,样本相关系数rxy表示如下:

其中,为x和y的协方差,为x的标准差;|r|表明两变量间的相关程度,r>0表示正相关,r<0表示负相关,r=0表示零相关;

步骤2.3:对信息增益和Pearson相关系数降序排列。

3.根据权利要求1所述的基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,步骤3的具体方法如下:

步骤3.1:对排序后的信息增益和Pearson相关系数根据百分比筛选有效的特征,并舍弃贡献较少的特征;

假设用于筛选的百分比为p,因素个数为k,单个因素与成绩的相关系数为rl,l=1,2,…,k,筛选到的自变量个数为:

其中为上取整;

步骤3.2:依据百分比筛选原则,选取信息增益和Pearson相关系数处于前N的特征并入特征子集;

步骤3.3:使用包裹式特征筛选法选出最终的有效特征子集。

4.根据权利要求3所述的基于支持向量机和最大互相关熵的成绩预测方法,其特征在于,步骤5的具体方法如下:

步骤5.1:将步骤4得到的及格样本集按照7:3分为训练数据样本和测试数据样本;

步骤5.2:对训练样本进行基于最大互相关熵的多元线性回归训练,建立多元线性回归模型为:

y=a0+a1x1+a2x2+…+akxk

对于模型学习而言,模型求解就是根据训练样本估计参数a0,a1,a2,…,ak;最大化基于互相关熵定义的目标函数,使用梯度下降法求取回归模型系数:

步骤5.3:在测试样本集上判断当前的预测均差是否已经符合要求,若已符合要求,则输出回归模型系数a,若预测误差尚未符合要求,则继续判断当前的迭代次数t是否已经达到预设的迭代最大值,若已经达到,则输出回归模型系数a,若尚未达到,则返回步骤3.3,继续迭代求解最优解。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910232831.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top