[发明专利]使用GPU/CPU体系结构的RSA的高效实现有效
申请号: | 201180075165.X | 申请日: | 2011-11-30 |
公开(公告)号: | CN103959238A | 公开(公告)日: | 2014-07-30 |
发明(设计)人: | 康晓珠;B·乔治;K·陆 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/45 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 高见 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 各实施例涉及在同一个处理器管芯上由CPU和GPU构成的异构型处理器体系结构。异构型处理器体系结构可以使用将任意矢量长度的指令简化为GPU支持的矢量长度的矢量条状提取以及循环剥离来在GPU编译器中优化源代码。首先可以判断,如果编译的源代码的一个以上的机器代码指令未充分使用GPU指令带宽限制,则源代码有资格获得优化。可以丢弃初始矢量条状提取结果,可以从循环中剥离内循环体的第一迭代。源代码中的操作数的类型可以被降低,可以再次矢量条状提取的源代码的剥离的内循环体,以获得优化的源代码。 | ||
搜索关键词: | 使用 gpu cpu 体系结构 rsa 高效 实现 | ||
【主权项】:
一种方法,包括:使用图形处理单元(GPU)编译器来编译具有内循环体的源代码;当编译的源代码的一个以上的机器代码指令未充分使用GPU指令带宽限制时:从所述循环中剥离所述内循环体的第一迭代;降低所述源代码中的操作数的类型;以及使用矢量条状提取将任意矢量长度的指令简化为源代码的所述剥离的内循环体中的图形处理单元(GPU)支持的矢量长度,以获取优化的源代码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201180075165.X/,转载请声明来源钻瓜专利网。