[发明专利]大数据增量迭代方法、装置、计算机设备和存储介质有效
申请号: | 201910460745.9 | 申请日: | 2019-05-30 |
公开(公告)号: | CN110232087B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 唐卓;张学东;阳王东;刘楚波;李肯立;李克勤;廖湘科 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶;张志刚 |
地址: | 410013 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 增量 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种大数据增量迭代方法、装置、计算机设备和存储介质。一个实施例中的方法包括:接收由图形处理器执行的有向无环图任务,获取与有向无环图任务对应的数据集,将数据集存储至图形处理器内存中的缓存;响应所述有向无环图任务,对数据集进行迭代计算,得到迭代计算后的数据集,并以迭代计算后的数据集对所述缓存中存储的数据集进行更新;当数据集发生增量变化时,基于缓存中存储的迭代计算后的数据集进行增量迭代计算,得到增量迭代后的数据集,以增量迭代后的数据集对所述缓存中的数据集进行更新。可以隐藏低带宽的输入/输出延迟,减少重复计算,从而减少计算总时间,提高大数据处理效率。
技术领域
本发明涉及数据处理领域,特别是涉及一种大数据增量迭代方法、装置、计算机设备和存储介质。
背景技术
随着社交网络、深度学习、大规模图计算等研究领域的发展,这些研究领域在社会应用发展中取得了巨大的进步,其应用范围越来越广,比如语音识别、图像识别、虚拟现实、增强现实、社交推荐等。在这些非线性的计算中存在大量的增量迭代计算,由于迭代过程本身存在重复的工作,优化这些工作将对计算效率产生显著影响。
在某些应用场景中,输入数据可能因为各种原因动态变化,而对数据的处理流程基本不变。输入数据的动态变化往往是从不同来源采集新的数据,传统的大数据处理方法,每次数据处理都针对所有的输入数据,需要付出大量的计算时间和资源;且随着输入数据的不断累积,所需的时间和资源将不断增加。即传统的大数据处理方法存在计算效率低的问题。
发明内容
基于此,有必要针对上述问题,提供一种可以提高大数据处理效率的大数据增量迭代方法、装置、计算机设备和存储介质。
一种大数据增量迭代方法,包括:
接收由图形处理器执行的有向无环图任务,获取与所述有向无环图任务对应的数据集,将所述数据集存储至图形处理器内存中的缓存;
响应所述有向无环图任务,对所述数据集进行迭代计算,得到迭代计算后的数据集,并以所述迭代计算后的数据集对所述缓存中存储的数据集进行更新;
当所述数据集发生增量变化时,基于所述缓存中存储的所述迭代计算后的数据集进行增量迭代计算,得到增量迭代后的数据集,以所述增量迭代后的数据集对所述缓存中的数据集进行更新。
在一个实施例中,所述缓存为共享内存,所述方法还包括:
当检测到所述共享内存上的数据集存储量大于预设阈值时,通过基于块的滑动窗口机制将所述共享内存上的数据集迁移至全局内存。
在一个实施例中,所述方法还包括:
当检测到与所述有向无环图任务对应的增量迭代计算停止时,将所述全局内存上的数据集迁移至中央处理器内存。
在一个实施例中,所述获取与所述有向无环图任务对应的数据集,将所述数据集存储至图形处理器内存中的缓存,包括:
获取与所述有向无环图任务对应的RDD格式的数据集;
对所述RDD格式的数据集进行数据格式转换,得到G-RDD格式的数据集,将所述G-RDD格式的数据集存储至图形处理器内存中的缓存。
在一个实施例中,所述对所述RDD格式的数据集进行数据格式转换,得到G-RDD格式的数据集,将所述G-RDD格式的数据集存储至图形处理器内存中的缓存,包括:
将所述RDD格式的数据集存储至数据缓冲区,调取所述数据缓冲区中的RDD格式的数据集进行数据格式转换,得到G-RDD格式的数据集,将所述G-RDD格式的数据集存储至图形处理器内存中的缓存。
在一个实施例中,所述获取与所述有向无环图任务对应的数据集,将所述数据集存储至图形处理器内存中的缓存,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910460745.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的信息管理系统
- 下一篇:分类合并的方法及装置、存储介质
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置