[发明专利]一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法有效
申请号: | 201710353362.2 | 申请日: | 2017-05-18 |
公开(公告)号: | CN107273094B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 敖玉龙;杨超;刘芳芳;尹万旺;魏迪;袁欣辉;蒋丽娟 | 申请(专利权)人: | 中国科学院软件研究所;无锡江南计算技术研究所 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/32;G06F9/38;G06F17/16 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 杨学明;顾炜 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适应于“神威·太湖之光”上HPCG优化的数据结构及其高效实现方法,基于“神威·太湖之光”上的申威众核处理器体系结构特征和HPCG算法优化的需要,使用了改进ELL格式的数据结构对原始数据结构进行替换,除了包含矩阵数据本身的数据结构,还支持分块着色,索引转换,进程通信,以及向量位置映射等相关的数据结构,并且中间处理过程采用了申威众核平台提供的Athread多线程库进行并行,最终应用于HPCG算法的核心函数SpMV和SymGS优化过程中,相应的性能和带宽百分比取得了一致性的加速比,最高分别为18.2和17.6。 | ||
搜索关键词: | 一种 适应 神威 太湖 hpcg 优化 数据结构 及其 高效 实现 方法 | ||
【主权项】:
一种适应于“神威·太湖之光”上HPCG优化的数据结构,其特征在于:所述自定义数据结构包括:经典ELL格式中的矩阵值vals数组和对应索引idx数组,利用额外的对角线元素diags数组来存放矩阵的对角线元素,还提供了分块着色相关和进程通信相关的数据结构,其中color_reordering存放分块着色之后新的块行顺序,color_info记录每种颜色的块行数量和位置;element_send标识当前进程向其他邻居进程所发送数据的位置信息,element_recv标识当前进程接受来自于其他邻居进程所数据所存放的位置信息;最后,为了减少直接访问主存的次数和支持计算过程中使用寄存器通信机制,分别增加了进程内索引到块内索引转换的数据结构loc2blk和外区索引向量的位置映射数据结构pos,通过使用该自定义的数据结构,能够在国产申威众核平台上实现HPCG的高效并行计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所;无锡江南计算技术研究所,未经中国科学院软件研究所;无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710353362.2/,转载请声明来源钻瓜专利网。