[发明专利]基于线性自学习网络的缺失值填补方法、存储介质及系统在审
申请号: | 202011052819.4 | 申请日: | 2020-09-29 |
公开(公告)号: | CN112085125A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 赵国帅;白凌南;李子烁;钱学明 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N5/02 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 线性 自学习 网络 缺失 填补 方法 存储 介质 系统 | ||
1.基于线性自学习网络的缺失值填补方法,其特征在于,包括以下步骤:
S1、获取没有缺失值的原始时序数据,对原始时序数据进行预处理,以随机概率构造缺失数据集,将新生成的缺失数据集和相对应的原始数据作为新的数据集;
S2、构建基于线性自学习网络模型,利用步骤S1生成的新数据集进行训练;
S3、利用步骤S2训练后的基于线性自学习网络模型,使用反向传播算法进行缺失值填补,将缺失值填补完成后的时间连续完整数据集用于循环神经网络的本质特征与缺失规律的模型训练中。
2.根据权利要求1所述的基于线性自学习网络的缺失值填补方法,其特征在于,步骤S1中,假设填补缺失值xi,j,元组xi-1和元组xi+1组成当前数据元组邻域;将当前元组xi中除xi,j以外的其他属性值添加到当前的数据元组邻域中,以形成xi,j的缺失值邻域,缺失值邻域将用于填补缺失值xi,j。
3.根据权利要求1所述的基于线性自学习网络的缺失值填补方法,其特征在于,步骤S2中,依次计算一个时间步的数据元组上的每个属性值,然后时间窗口移至下一个时间步;当前元组中的每个属性值都有3d-1参数;结果,时间窗口是一组d*(3d-1)个参数的线性网络结构。
4.根据权利要求3所述的基于线性自学习网络的缺失值填补方法,其特征在于,根据参数集wi,j和缺失值邻域集MVNi,j,通过线性网络计算缺失值的填补值yi,j如下:
其中,k表示参数集或缺失值邻域集中的第k个值。
5.根据权利要求1所述的基于线性自学习网络的缺失值填补方法,其特征在于,步骤S3中,将缺失值邻域分为两个不相交的子集:不完整邻域集,由缺失值组成;完整邻域集,由完整值组成;当缺失值邻域中包含有其他缺失值时,通过最小化损失函数来优化参数和缺失值,使用均方误差函数计算损失值Li,j;在对缺失值的训练过程中,通过利用完整数据与网络计算得到前向输出值计算损失后,对权重参数和缺失值求导来优化网络权重参数和缺失值;然后为所有缺失值赋初始值,使用反向传播算法在迭代过程中进行优化。
6.根据权利要求5所述的基于线性自学习网络的缺失值填补方法,其特征在于,损失值Li,j为:
Li,j=(xi,j-yi,j)2
其中,xi,j为第i个时间步的第j个属性值,yi,j为缺失值邻域。
7.根据权利要求5所述的基于线性自学习网络的缺失值填补方法,其特征在于,优化网络权重参数和缺失值:
其中,k∈MVN,p∈IMVN。
8.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至7所述的方法中的任一方法。
9.一种基于线性自学习网络的缺失值填补系统,其特征在于,包括:
处理器以及与所述处理器耦合的存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现权利要求1至7所述的方法中的任一方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011052819.4/1.html,转载请声明来源钻瓜专利网。