[发明专利]基于子空间学习的医疗数据集特征降维方法在审
申请号: | 201910546805.9 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110364264A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 庾安妮;徐雷 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 马鲁晋 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于子空间学习的医疗数据集特征降维方法,该方法包括以下步骤:根据待分析的医疗数据集构建原始高维数据矩阵X和标签列;构造最优化目标函数,求解其拉格朗日函数;根据原始高维数据矩阵和标签列,计算全局判别信息和局部判别信息;迭代求解转化矩阵Q,直到目标函数收敛或者达到最大循环次数,获得降维后的数据矩阵;根据求得的转化矩阵训练模型,求出AUC值评价降维矩阵和分类准确率。相较于目前的医疗数据集的特征降维方法,本发明的方法同时利用数据的局部判别信息和全局判别信息进行降维,不仅适用于一般规模下的特征降维问题,在数据的特征规模远大于样本规模时仍然具有较高的分类准确率。 | ||
搜索关键词: | 矩阵 特征降维 医疗数据 降维 分类准确率 子空间学习 高维数据 求解 标签 最优化目标函数 矩阵训练 目标函数 数据矩阵 特征规模 样本规模 大循环 迭代 构建 全局 转化 收敛 分析 | ||
【主权项】:
1.一种基于子空间学习的医疗数据集特征降维方法,其特征在于,包括以下步骤:步骤1、根据待分析的医疗数据集构建原始高维数据矩阵X和标签列;步骤2、构造最优化目标函数,求解其拉格朗日函数,并初始化拉格朗日函数的参数和变量;步骤3、根据原始高维数据矩阵和标签列,求取医疗数据集中样本的类间散度矩阵Sb和类内散度矩阵Sw,由此获得全局判别信息;步骤4、根据原始高维数据矩阵和标签列,构建医疗数据集中样本的类间邻接图Gb和类内邻接图Gw,并分别求取相应的Laplacian矩阵Lb和Lw,由此获得局部判别信息;步骤5、结合上述求解的Sb、Sw、Gw、Gb对拉格朗日函数进行迭代,求取用于降维重构原始高维数据矩阵的转化矩阵Q和P、误差矩阵E和拉格朗日乘子Y,直到目标函数收敛或者达到设定的最大循环次数,最终获得的矩阵QTX即为降维后的数据矩阵;步骤6、利用转化矩阵Q训练分类器,之后根据分类器的AUC值对矩阵QTX进行评价。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910546805.9/,转载请声明来源钻瓜专利网。