[发明专利]一种基于K平面回归的缺失数据补全方法在审
申请号: | 201511025065.2 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105469123A | 公开(公告)日: | 2016-04-06 |
发明(设计)人: | 袁玉波;阮彤;邱文强;汤伟;赵婷婷;高炬;殷亦超 | 申请(专利权)人: | 华东理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200237 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 平面 回归 缺失 数据 方法 | ||
1.一种基于K平面回归的缺失数据补全方法,其特征在于:对缺失数据进行补全时,进行以下步骤,
步骤1,人工进行数据缺失检测,并将需要补全的数据作为输出端,其余的数据作为输入端;
步骤2,进行参数的初始化设定;
步骤3,使用PCA对输入数据进行维度约减;
步骤4,将由步骤3得到的数据进行归一化到0-1之间,并选取70%的数据作为训练集,其余30%的数据作为测试集;
步骤5,用Kmeans聚类算法对训练集进行聚类分析获得初始的几何中心μ;
步骤6,最小化误差函数,反复迭代分别求每个平面的回归系数ω和几何中心μ;
步骤7,由步骤6得到的参数ω和μ,并对测试数据进行回归预测,得到的结果就是补全得到的数据。
步骤8,由步骤7得到的补全数据后,定义最大偏差、最小偏差、平均偏差和预测精度这四个指标来评价补全算法的性能。
2.根据权利要求1所述的基于K平面回归的缺失数据补全方法,其特征在于:步骤3所述的在对缺失数据进行补全之前,对数据集进行降维操作。对于每一个需要进行补全的数据集,必定存在高相关性维度和低相关性维度,我们使用PCA(主成分分析)方法对数据集进行主成分选择,计算每个维度的特征值和相应的特征向量,挑选高相关度的维度作为补全的主要输入,并且定义一个贡献率,如下所示,
R表示前d个特征占总特征值的比例,我们定义R大于95%时的前d个特征值就是我们维数约简后的维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511025065.2/1.html,转载请声明来源钻瓜专利网。