[发明专利]大数据增量迭代方法、装置、计算机设备和存储介质有效

专利信息
申请号: 201910460745.9 申请日: 2019-05-30
公开(公告)号: CN110232087B 公开(公告)日: 2021-08-17
发明(设计)人: 唐卓;张学东;阳王东;刘楚波;李肯立;李克勤;廖湘科 申请(专利权)人: 湖南大学
主分类号: G06F16/25 分类号: G06F16/25
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 黄晶晶;张志刚
地址: 410013 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 增量 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请涉及一种大数据增量迭代方法、装置、计算机设备和存储介质。一个实施例中的方法包括:接收由图形处理器执行的有向无环图任务,获取与有向无环图任务对应的数据集,将数据集存储至图形处理器内存中的缓存;响应所述有向无环图任务,对数据集进行迭代计算,得到迭代计算后的数据集,并以迭代计算后的数据集对所述缓存中存储的数据集进行更新;当数据集发生增量变化时,基于缓存中存储的迭代计算后的数据集进行增量迭代计算,得到增量迭代后的数据集,以增量迭代后的数据集对所述缓存中的数据集进行更新。可以隐藏低带宽的输入/输出延迟,减少重复计算,从而减少计算总时间,提高大数据处理效率。

技术领域

发明涉及数据处理领域,特别是涉及一种大数据增量迭代方法、装置、计算机设备和存储介质。

背景技术

随着社交网络、深度学习、大规模图计算等研究领域的发展,这些研究领域在社会应用发展中取得了巨大的进步,其应用范围越来越广,比如语音识别、图像识别、虚拟现实、增强现实、社交推荐等。在这些非线性的计算中存在大量的增量迭代计算,由于迭代过程本身存在重复的工作,优化这些工作将对计算效率产生显著影响。

在某些应用场景中,输入数据可能因为各种原因动态变化,而对数据的处理流程基本不变。输入数据的动态变化往往是从不同来源采集新的数据,传统的大数据处理方法,每次数据处理都针对所有的输入数据,需要付出大量的计算时间和资源;且随着输入数据的不断累积,所需的时间和资源将不断增加。即传统的大数据处理方法存在计算效率低的问题。

发明内容

基于此,有必要针对上述问题,提供一种可以提高大数据处理效率的大数据增量迭代方法、装置、计算机设备和存储介质。

一种大数据增量迭代方法,包括:

接收由图形处理器执行的有向无环图任务,获取与所述有向无环图任务对应的数据集,将所述数据集存储至图形处理器内存中的缓存;

响应所述有向无环图任务,对所述数据集进行迭代计算,得到迭代计算后的数据集,并以所述迭代计算后的数据集对所述缓存中存储的数据集进行更新;

当所述数据集发生增量变化时,基于所述缓存中存储的所述迭代计算后的数据集进行增量迭代计算,得到增量迭代后的数据集,以所述增量迭代后的数据集对所述缓存中的数据集进行更新。

在一个实施例中,所述缓存为共享内存,所述方法还包括:

当检测到所述共享内存上的数据集存储量大于预设阈值时,通过基于块的滑动窗口机制将所述共享内存上的数据集迁移至全局内存。

在一个实施例中,所述方法还包括:

当检测到与所述有向无环图任务对应的增量迭代计算停止时,将所述全局内存上的数据集迁移至中央处理器内存。

在一个实施例中,所述获取与所述有向无环图任务对应的数据集,将所述数据集存储至图形处理器内存中的缓存,包括:

获取与所述有向无环图任务对应的RDD格式的数据集;

对所述RDD格式的数据集进行数据格式转换,得到G-RDD格式的数据集,将所述G-RDD格式的数据集存储至图形处理器内存中的缓存。

在一个实施例中,所述对所述RDD格式的数据集进行数据格式转换,得到G-RDD格式的数据集,将所述G-RDD格式的数据集存储至图形处理器内存中的缓存,包括:

将所述RDD格式的数据集存储至数据缓冲区,调取所述数据缓冲区中的RDD格式的数据集进行数据格式转换,得到G-RDD格式的数据集,将所述G-RDD格式的数据集存储至图形处理器内存中的缓存。

在一个实施例中,所述获取与所述有向无环图任务对应的数据集,将所述数据集存储至图形处理器内存中的缓存,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910460745.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top