[发明专利]内存计算的缓存优化方法有效

申请号：	201310531246.7	申请日：	2013-11-01
公开（公告）号：	CN103631730A	公开（公告）日：	2014-03-12
发明（设计）人：	陈康;艾智远;冯琳;周佳祥	申请（专利权）人：	深圳清华大学研究院
主分类号：	G06F12/12	分类号：	G06F12/12
代理公司：	深圳市鼎言知识产权代理有限公司 44311	代理人：	孔丽霞
地址：	518057 广东省深圳市南山区高***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	发明提供一种内存计算的缓存优化方法，该方法包括：在Spark源程序中插入监听代码，对应用程序进行动态语义分析以构造DAG图；计算DAG中各顶点出度并筛选出出度大于1的顶点对应的RDD，筛选出的RDD为需要缓存至内存的RDD；根据贪心算法调整Action的执行顺序以优化RDD数据计算的访问顺序；计算RDD的权重，根据内存替换算法决定内存中被替换出的RDD；及根据多级缓存算法决定如何处理被替换出的RDD。应用本发明所述内存计算的缓存优化方法，无需程序员在编程时考量内存使用以及显示指定加载内存的RDD，降低程序员的编程负担，同时提高了内存的利用率进而提升大数据处理的速度。
搜索关键词：	内存计算缓存优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种内存计算的缓存优化方法，其特征在于，该方法包括：构造DAG步骤：在Spark的源程序代码中插入监听代码，以样本数据作为输入预先执行应用程序，对应用程序进行动态语义分析，获取所有RDD函数操作的输入RDD ID、操作类型、输出RDD ID，根据获取的信息构造DAG；筛选RDD步骤：遍历上述DAG，计算各顶点的出度，筛选出出度大于1的顶点对应的RDD并建立RDD集合S，该集合S中的RDD为需要缓存至内存中的RDD；Action执行顺序调整步骤：调整上述RDD集合S中所有RDD的Action执行顺序，以优化需要缓存至内存的RDD数据计算的访问顺序；RDD权重计算步骤：计算所述RDD集合S中所有RDD的权重；RDD替换步骤：当输入真正的作业数据执行应用程序时，根据优化的RDD数据计算的访问顺序，依次将RDD缓存至内存，若内存已满，根据内存替换算法决定从内存中被替换出的RDD；RDD处理步骤：根据多级缓存算法确定被替换出的RDD是直接丢弃还是存储至磁盘。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳清华大学研究院，未经深圳清华大学研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310531246.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F12-00 在存储器系统或体系结构内的存取、寻址或分配
G06F12-02 .寻址或地址分配；地址的重新分配
G06F12-14 .阻止存储器越权使用的保护
G06F12-16 .阻止存储物丢失的保护
G06F12-04 ..字长可变的字或字的一部分的寻址
G06F12-06 ..物理存储块定位的寻址，例如，基地址寻址、模块寻址、专用存储区寻址

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]内存计算的缓存优化方法有效

专利文献下载