[发明专利]一种基于自适应线程束的GPU并行粒子群优化方法有效
申请号: | 201610976893.2 | 申请日: | 2016-10-28 |
公开(公告)号: | CN106502632B | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 何发智;张硕 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06N3/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自适应线程束的GPU并行粒子群优化方法,包括以下步骤:1:初始化问题函数参数,初始化粒子群参数;2:定义三个CUDA核函数,分别用于并行计算粒子的速度和位置、粒子的适应度值及下一代粒子自身所找到的最好适应度值及其对应的解、整个粒子群到目前为止找到的最好适应度值及其对应的解;3:根据自适应线程束算法计算并初始化每个核函数的Block及Grid参数;4:调用核函数并行迭代更新粒子群的速度和位置,并求出当前最好适应度值及其对应的解;5:重复执行步骤4直到达到设定的结束条件,GPU输出计算结果;本发明可以大幅缩短粒子群算法在GPU上的并行求解时间、减少功耗、节约硬件成本。 | ||
搜索关键词: | 一种 基于 自适应 线程 gpu 并行 粒子 优化 方法 | ||
【主权项】:
1.一种基于自适应线程束的GPU并行粒子群优化方法,其特征在于,将每个粒子的维度划分为若干个线程束,使用线程块来包含所述线程束,使得一个线程块中对应一个或多个粒子;其中,所述线程束是SM调度和执行的基本单位;基于以下公式调整粒子所对应的线程束的个数WarpNum以及线程块所对应的粒子数ParticleNum:WarpNum=DivUp(D,WarpSize) (8)ThreadNum=WarpNum*WarpSize (9)ParticleNum=DivDown(BlockSize,ThreadNum) (10)式中,D表示求解问题的维度,WarpSize表示CUDA架构中一个线程束的大小;DivUp函数的功能是将D除以WarpSize得到的商做向上取整,以得到粒子所对应Warp的个数WarpNum;ThreadNum用来表示每个粒子实际用到的线程总数;BlockSize表示CUDA架构中一个Block的大小,DivDown函数的功能是将BlockSize除以ThreadNum得到的商做向下取整,以得到Block所对应的粒子数ParticleNum。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610976893.2/,转载请声明来源钻瓜专利网。