[发明专利]一种基于生成对抗网络的属性缺失数据集补全与预测方法有效
申请号: | 201810722774.3 | 申请日: | 2018-07-04 |
公开(公告)号: | CN109165664B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 赵跃龙;王禹 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于生成对抗网络的属性缺失数据集补全与预测方法,包括步骤:1)对数据minmax归一化,同时对离散类型的属性使用one hot编码,缺失值标记为0;2)使用数据集建立关于样本的缺失位置编码向量;3)构建生成式对抗网络与辅助预测网络进行数据填充与标签的预测;4)根据属性中最大最小值还原为minmax归一化前的结果;5)通过测试选取合适的超参数;本发明充分利用数据集中数据分布信息与标签信息,能够对高维度缺失数据集进行有效的数据填充,同时在训练完成之后,该方法中包含的另一辅助预测网络能够直接队输入的属性缺失数据给出标签的预测结果,流程简捷、具有更高的预测准确率。 | ||
搜索关键词: | 一种 基于 生成 对抗 网络 属性 缺失 数据 集补全 预测 方法 | ||
【主权项】:
1.一种基于生成对抗网络的属性缺失数据集补全与预测方法,其特征在于:首先,针对属性缺失的数据集进行数据预处理,主要包括minmax归一化和离散的数值变量的one hot编码转换;然后针对具有属性缺失的样本,构建缺失位置的编码向量,从而表达缺失的位置信息;接着构建缺失数据的填充网络与辅助预测网络同步完成缺失数据的填充与标签预测;在网络训练完成之后,以填充网络中生成网络的输出结果为填充的结果,根据minmax归一化时记录的列最大最小值进行尺度还原;最后,通过不断修改超参数观测其在验证集的预测结果的损失来完成超参数的设置;其包括以下步骤1)数据预处理;2)构建缺失位置编码向量;3)构建缺失数据填充网络与辅助预测网络;4)填充数据尺度还原;5)测试与超参数设置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810722774.3/,转载请声明来源钻瓜专利网。