[发明专利]一种基于大数据的复杂面板数据学习方法有效
申请号: | 201810343772.3 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108596344B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 蒋辉;刘波;蒋思阳 | 申请(专利权)人: | 惠州学院 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 广州睿金泽专利代理事务所(普通合伙) 44430 | 代理人: | 刘晓钰 |
地址: | 516007 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 复杂 面板 学习方法 | ||
本发明公开了一种基于大数据的复杂面板数据学习方法,充分利用新增时间序列所含信息增量的同时,控制时间序列数据容量,从而控制计算成本和计算机存储容量;充分利用横截面数据所含维度信息的同时,控制支撑维度容量,从而将计算成本与存储容量控制在计算资源许可范围之内;在面板数据容量有限的条件下,保证学习的泛化性能,给出所拟算法的泛化理论界;研究复杂面板数据白噪声过滤理论与方法,保证学习模型的鲁棒性,采用动态向量融合技术,计算性能稳健,时间序列与横截面高维的复杂面板数据问题,采用线性学习模式,实现其双向数据容量同时得到控制的在线核学习。
技术领域
本发明涉及到一种面板数据学习方法,特别涉及一种基于大数据下的面板数据学习方法。
背景技术
面板数据的研究绝大多数是基于计量经济的建模理论与应用,一般存在对数据模型的假定,且是批量数据学习模式。然而,随着社会经济关系的复杂化,面板数据呈现出许多新的特点,主要表现在数据规模庞大、关系错综复杂、数据污染严重和数据缺失等多个方面,在当今大数据环境下,原有的模型假定在大数据背景下不一定成立。同时,计算机存储容量的限制也约束了原有面板数据模型的正常使用。
发明内容
为这解决现有面板数据污染严重和数据缺失的问题,本发明的目的在于提供一种基于大数据的复杂面板数据学习方法,寻求降低计算代价、节约计算机存储资源的复杂面板数据处理模式,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于大数据的复杂面板数据学习方法,包括以下步骤;
S1:充分利用新增时间序列所含信息增量的同时,控制时间序列数据容量,从而控制计算成本和计算机存储容量;
S2:充分利用横截面数据所含维度信息的同时,控制支撑维度容量,从而将计算成本与存储容量控制在计算资源许可范围之内;
S3:在面板数据容量有限的条件下,保证学习的泛化性能,给出所拟算法的泛化理论界;
S4:研究复杂面板数据白噪声过滤理论与方法,保证学习模型的鲁棒性。
优选的,在步骤S1,面板数据中时间序列的支撑容量控制,以某种方式保留支撑数据集对学习函数的整体贡献,过滤支撑集数据容量增加带来的信息冗余,结合前述时间序列容量控制思想,同时控制模型的双向支撑数据容量对于时间序列控制,以动态的方式分步融合特征空间选定的两支撑向量,最大限度地消除信息冗余,选择最佳的向量融合方式。
优选的,在步骤S2,对面板数据中横截面维度的控制,过滤贡献不大的维度信息,同时保证所得学习模型的整体性能;对于面板数据双向支撑数据容量的同时控制,以合并横截面维度信息,降低核函数的计算成本,同时;对于横截面维度控制,以某种基本范数,保证模型的基本泛化性能,避免稀疏过度或不当;同时以另一稀疏范数,控制数据横截面维度容量即非零权数的数量,选择最佳泛数及组合方式。
优选的,在步骤S3,中分析所拟算法的理论界,在相关应用领域数据集上实验验证所拟方法,并与相关算法在学习性能、算法稳定性、计算成本等方面进行比较。
优选的,在步骤S4中,所得理论成果与相应算法应用于经济、管理、生物、心理、健康科学等具体领域,系统化研究成果,力争开发具体工具,实现成果转化。
与现有技术相比,本发明的有益效果是:基于大数据的复杂面板数据学习方法,动态策略能剔除选定的任何支撑数据及其冗余信息,同时保留数据递增带来的信息增量;向量融合技术则用来逼近原学习问题的最优解,从理论与实践两方面保证学习性能,采用动态向量融合技术,计算性能稳健,单步计算成本低廉,时间序列与横截面高维的复杂面板数据问题,采用线性学习模式,实现其双向上数据容量同时得到控制的在线核学习,其思想本身就具有一定的新颖度,提出面板数据学习的新的滤波方法,构造基于HASH编码或随机投影的在线核学习算法,以HASH编码或随机投影方法,合并某些维度上的信息,在此基础上引入核方法,提升所拟算法的非线性表述能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠州学院,未经惠州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343772.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置