[发明专利]基于FFT的大整数乘法SSA算法多核并行化实现方法有效
申请号: | 201510157957.1 | 申请日: | 2015-04-03 |
公开(公告)号: | CN104731563B | 公开(公告)日: | 2017-07-11 |
发明(设计)人: | 赵玉文;刘芳芳;杨超;解庆春;蒋丽娟 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F17/14 |
代理公司: | 北京科迪生专利代理有限责任公司11251 | 代理人: | 成金玉,孟卜娟 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于FFT的大整数乘法SSA算法多核并行化实现方法,其是从细粒度的角度对大整数乘法SSA算法进行多核并行优化,其核心是对利用SSA算法求取负循环卷积的四个核心计算过程分别进行并行设计,即分别对分解、FFT正变换、点乘和FFT逆变换四个计算过程进行优化。本发明充分利用硬件的多核资源,提高运行速度,在实际应用中有着十分重要的作用。 | ||
搜索关键词: | 基于 fft 整数 乘法 ssa 算法 多核 并行 实现 方法 | ||
【主权项】:
一种基于FFT的大整数乘法S SA算法多核并行化实现方法,其特征在于:对利用SSA算法求取负循环卷积的四个核心计算过程分别进行多核并行设计,即分别对分解、FFT正变换、点乘和FFT逆变换四个计算过程进行优化,实现步骤如下:(A1)判断输入的两个大整数A和B是否是平方操作,如果是平方操作,只对其中一个大整数A进行分解操作,调用串行分解算法完成计算,然后执行步骤(A2);如果不是平方操作,两个线程并行执行大整数A和B的分解操作,每个线程调用串行分解算法完成计算,然后执行步骤(A2);(A2)对步骤(A1)中求取的大整数A的分解结果使用两个线程并行进行傅里叶正变换,其中只对递归的第一层进行并行,即函数内部的两次递归调用本函数过程利用共享存储并行编程OpenMP中的任务并行方式即section方式,两个线程并行执行,接下来执行步骤(A3);如果不是平方操作,两个线程并行执行对步骤(A1)中求取的大整数A和B的分解结果的傅里叶正变换,每个线程调用串行傅里叶正变换算法完成计算,然后执行步骤(A4);(A3)对步骤(A2)中得到的大整数A的傅里叶正变换的结果,利用共享存储并行编程OpenMP中的for循环迭代多线程并行执行点乘操作,点乘内容是A的傅里叶正变换结果和A的傅里叶正变换结果,然后执行步骤(A5),但是需要注意的是S SA算法本身是递归算法,当进行点乘的数据规模很大时,多个线程内的每对元素的乘法调用串行S SA算法进行;(A4)对步骤(A2)中得到的大整数A和B的傅里叶正变换的结果,利用共享存储并行编程OpenMP中的for循环迭代多线程并行执行点乘操作,点乘内容是A的傅里叶正变换结果和B的傅里叶正变换结果,然后执行步骤(A5),但是需要注意的是SSA算法本身是递归算法,当进行点乘的数据规模很大时,多个线程内的每对元素的乘法调用串行S SA算法进行;(A5)对步骤(A3)或步骤(A4)中求取的大整数A和B的点乘结果,利用两个线程并行进行傅里叶逆变换,其中只对递归的第一层进行并行,即函数内部的两次递归调用本函数过程利用section方式,两个线程并行执行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510157957.1/,转载请声明来源钻瓜专利网。
- 上一篇:多系统和启动所述多系统的方法
- 下一篇:在SIMD处理单元中的任务执行