[发明专利]面向异构众核多级存储结构的数据分布与局部性优化方法有效
申请号: | 201310148326.4 | 申请日: | 2013-04-25 |
公开(公告)号: | CN103226487A | 公开(公告)日: | 2013-07-31 |
发明(设计)人: | 姚远;赵荣彩;韩林;李雁冰;黄品丰 | 申请(专利权)人: | 中国人民解放军信息工程大学 |
主分类号: | G06F9/45 | 分类号: | G06F9/45;G06F12/08 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 陈大通 |
地址: | 450002*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向异构众核多级存储结构的数据分布与局部性优化方法,具体为:对程序进行数据流分析,完成数据在不同类型核心的存储器之间的高效映射和布局,通过自动生成指导数据分布的相关数据管理子句,显式控制局部存储器与主存储器的数据传输,决定数据进入局部存储器以及从局部存储器写回的时机、位置和内容,优化异构众核多级存储结构的存储性能;具体含有下列步骤:步骤1:数据规模自适应的数组分块;步骤2:数组访问模式指导的数据分布;步骤3:主从协作的数组转置;步骤4:外围数据传输简化;本发明提升了程序的执行效率。 | ||
搜索关键词: | 面向 异构众核 多级 存储 结构 数据 分布 局部性 优化 方法 | ||
【主权项】:
一种面向异构众核多级存储结构的数据分布与局部性优化方法,其特征是:对程序进行数据流分析,完成数据在不同类型核心的存储器之间的高效映射和布局,通过自动生成指导数据分布的相关数据管理子句,显式控制局部存储器与主存储器的数据传输,决定数据进入局部存储器以及从局部存储器写回的时机、位置和内容,优化异构众核多级存储结构的存储性能;具体含有下列步骤:步骤1:数据规模自适应的数组分块:通过自动生成数组分块子句,把程序中不同规模的大数组划分为小数组,该小数组的大小适合于运算核心中的局部存储器的容量;步骤2:数组访问模式指导的数据分布:分析小数组的访问模式,若该访问模式是规则访问,则生成带数据划分信息的数据拷贝子句,将计算所需数据截取和传输进局部存储器;若该访问模式不是规则访问,则生成缓存子句,将不规则访问的数组映射到软件cache;步骤3:主从协作的数组转置:判断小数组下标索引变量次序和循环嵌套迭代次序是否一致,当两个次序不一致时,按循环嵌套的迭代次序对数组进行转置,通过数组转置子句使数组通过连续的数据拷贝操作从主存储器传送到从核的局部存储器,并获得与循环嵌套访问方式一致的存储方式,从而将不连续访存转换为连续访存,提高并行程序性能;步骤4:外围数据传输简化:生成加速数据区编译指示,将循环嵌套内层并行循环的数据传输子句转移到循环嵌套外层的加速数据区,仅在循环计算开始前和循环计算结束后进行数据传输,避免外层串行循环执行时内层并行循环的多次数据拷贝。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军信息工程大学,未经中国人民解放军信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310148326.4/,转载请声明来源钻瓜专利网。
- 上一篇:多操作系统业务的部署方法和系统
- 下一篇:对浏览器运行进行优化的方法和装置