[发明专利]一种利用GPU加速介观体系物理问题求解的方法有效

申请号：	201210128993.1	申请日：	2012-04-28
公开（公告）号：	CN102663207A	公开（公告）日：	2012-09-12
发明（设计）人：	刘羽	申请（专利权）人：	浪潮电子信息产业股份有限公司
主分类号：	G06F17/50	分类号：	G06F17/50
代理公司：	暂无信息	代理人：	暂无信息
地址：	250014 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种利用 gpu 加速体系物理问题求解方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及高性能计算领域在计算物理学和纳米材料科学方面的应用，具体涉及一种利用GPU来加速介观体系物理问题求解中的大规模哈密顿（Hamiltonian）矩阵初始化计算，来求解微、纳电子结构的方法。具体地说是一种利用GPU加速量子介观体系求解的方法。

背景技术

随着人类社会的不断进步，科学技术的发展，人们对自然界的认识越来越广泛，并逐步的向微、纳观等物理体系结构深入。与此同时，生物技术、化学生产及制药的需求，也迫切的要求人们能够在电子、原子或分子尺度上来精确把握物体的性态，因此对介观体系的研究是与人类的生活密切关。就信息产业来说，现在的微处理器及存储器芯片的基本组成单元–晶体管的尺度已经达到了几十个纳米，已处理介观体系的范畴。通过对介观物理体系的研究，一方面可以给出现有器件尺寸减小的下限，此时原来的理论分析方法，诸如欧姆定律等均已不再适用；另一方面，新发现的物理现象也为制作新型量子器件及新型材料提供了物理学基础，如量子点激光器等。

一般说来属于介观范畴的物理体系种类很多，包括量子点（也称作人造原子）、量子环、纳米线、纳米弹簧等等。实现从理论上对这些介观物理体系的研究和计算对实验研究以及量子器件的制备具有重要的现实意义。自上个世纪量子力学理论诞生以来，人们逐步发展了诸如绝热近似、哈特里近似、哈特里-福克近似（Hartree-Fock）、密度泛函理论（DFT）、变分法（Variational Method）、随机相近似（Random-Phase Approximation）、分子动力学方法以及组态相互作用（Configuration Interaction）方法等等，来计算介观体系的物理问题。这些方法适用于不同的场合，对特定的介观体系有不错的计算效果。但对于需要考虑电子自旋的介观体系或稀磁半导体等物理问题，人们往往还是从介观体系的严格的系统哈密顿量出发，通过选取合适的基矢函数将哈密顿算符展开成哈密顿矩阵，并通过求解量子力学本征值问题来得到介观的各物理量。相比较而言，该基展开哈密顿量的方法物理意义明确，且是数值精确的，只要基矢的数目足够多，所得到的结果将是严格的。

在实际计算过程中，根据所研究介观体系的拓扑结构特点，人们往往选用不同的基矢以达到最快速收敛的目的。常用的基矢有：平面波型基矢、勒让德型基矢、贝塞尔基矢、拉盖尔基矢等等。为了使计算的结果尽可能的精确或计算体系的需求，实际往往需要大量的基矢（设为M），但随着基矢数目的增多，哈密顿矩阵的规模也急剧的扩大（M²），从而导致哈密顿矩阵的初始化工作繁重，甚至于计算中绝大部分的时间都将花费在哈密顿矩阵元的初始化计算上。如果我们可以加速哈密顿矩阵元的初始化，那么整个计算并不会花费太多的时间。因此，如何加速哈密顿矩阵元初始化是本发明所要解决的主要问题。

发明内容

本发明的目的是设计一种利用GPU来加速介观体系物理问题哈密顿量矩阵元基矢展开求解的方法，从而充分发挥GPU众核结构的多计算处理单元、高带宽优势，以及CPU的逻辑处理能力和主内存的大容量优势，来大幅缩短对介观体系的计算模拟时间。

本发明的目的是按以下方式实现的，针对基矢展开计算的特点，将计算过程分为两个主要步骤：初始化哈密顿量矩阵元和哈密顿矩阵对角化，对于初始化哈密顿量矩阵元，由于需要初始化的矩阵元数目相对较大，要求较多的计算资源和较高的存储器带宽，而相应的对存储器的容量需求较小，因此我们将这部分计算移植到GPU上来完成，而即哈密顿矩阵对角化，是对整个哈密顿矩阵的归约操作，它需要占用大量的内存资源，并且由于矩阵各部分的依赖关系，大部分时间是做串行处理，因此我们将其交给CPU来完成，将介观物理体系哈密顿量矩阵元独立出来，然后将由这些独立的矩阵元所构成的问题解空间同GPU中的线程空间相对应，将内存中的初始参数传入GPU设备显存，并在设备上计算矩阵元，完毕后拷贝结果回主机内存，从而完成介观体系哈密顿量矩阵初始化，再利用CPU对哈密顿矩阵对角化求得本征能量和本征态矢，从而有效加速介观物理问题求解的计算，具体步骤如下：

1）将问题解空间同GPU线程空间相对应，利用哈密顿量矩阵元之间的非相关性，将矩阵元与CUDA的三重线程模型对应起来，即同Grid，Block，Thread对应起来，问题的规模与计算中所使用的基矢数目有关；

2）将参数传入显存并执行运算，将基矢系数等参数传递给显存，包括与所使用基矢有关的贝塞尔零点，并将少数调用频繁的参数存放在缓存中，执行设备端的kernel函数完成计算；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司，未经浪潮电子信息产业股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210128993.1/2.html，转载请声明来源钻瓜专利网。

上一篇：导热硅脂组合物
下一篇：一种基于服务器和导航终端的自动导航系统及其实现方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种利用GPU加速介观体系物理问题求解的方法有效

专利文献下载