[发明专利]面向GPDSP的矩阵LU分解向量化计算的方法有效

专利信息
申请号: 201510063817.8 申请日: 2015-02-06
公开(公告)号: CN104636315B 公开(公告)日: 2017-12-22
发明(设计)人: 刘仲;陈书明;郭阳;陈海燕;田希;陈磊;胡封林;刘蓬侠;刘胜;雷元武;扈啸;陈跃跃;王耀华 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06F17/16 分类号: G06F17/16;G06F13/28
代理公司: 湖南兆弘专利事务所(普通合伙)43008 代理人: 周长清
地址: 410073 湖南省长沙市砚瓦池正*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种面向GPDSP的矩阵LU分解向量化计算的方法,其步骤为S1根据GPDSP的体系结构特征确定最佳的LU分解的矩阵规模N值;S2DSP核通过DMA从片外DDR存储器将要处理的矩阵数据传输到片内共享存储阵列中;S3DSP核按照列选主元方法,计算第i列的主元值以及对应的列元素序号值;S4根据列li的列主元Pi以及对应的列元素序号值Vi对矩阵A内列主元Pi所在的行与列首元l[i]所在的行进行交换;S5DSP核对列li按照公式li=li/l[i]进行列消元计算,更新列li;S6DSP核进行更新矩阵panel的计算;S7判断i是否等于N‑1,若不是,令i=i+1,转步骤S3,若是转步骤S8;S8计算完毕。本发明能充分利用DSP核向量处理阵列的强大并行计算、高带宽向量数据加载能力,显著提高DSP核计算访存比。
搜索关键词: 面向 gpdsp 矩阵 lu 分解 量化 计算 方法
【主权项】:
一种面向GPDSP的矩阵LU分解向量化计算的方法,其特征在于,步骤为:S1:根据GPDSP的体系结构特征确定最佳的LU分解的矩阵规模N值;S2:GPDSP的DSP核通过DMA从片外DDR存储器将需要处理的矩阵数据传输到片内共享存储阵列中;S3:GPDSP的DSP核按照列选主元方法,计算第i列的主元值以及对应的列元素序号值,初始i=0;S4:GPDSP的DSP核根据上述计算得到的列li的列主元Pi以及对应的列元素序号值Vi对矩阵A内列主元Pi所在的行与列首元l[i]所在的行进行交换;S5:GPDSP的DSP核对列li按照公式li=li/l[i]进行列消元计算,更新列li;在所述步骤S5中,将片内共享存储阵列矩阵A中,列首元l[i]右下方的矩阵记为L’i,矩阵A中第i行位于上三角C的部分记为ui,列首元l[i]右方包括ui部分的矩阵记为Li,列li不包括列首元l[i]的部分记为列l’i;S6:GPDSP的DSP核按照L’i=L’i‑l’i*ui进行更新矩阵panel的计算;S7:判断i是否等于N‑1,若不是,令i=i+1,转步骤S3,若是转步骤S8;S8:矩阵A的LU分解计算完毕;DSP核使用DMA将矩阵A从片内共享存储阵列传输到片外DDR存储器的原存储位置;所述步骤S3的详细流程为:S3.1:DSP核通过DMA将列li从片内共享存储阵列中传输至片内向量阵列存储器;设初始值为全0的向量寄存器Z2和向量寄存器Z5,以及初始值为{0,1,2,…,p‑1}的向量寄存器Z4;S3.2:DSP核的向量处理阵列依次通过向量LOAD指令加载p个元素,存入向量寄存器Z0;S3.3:DSP核的向量处理阵列对上述向量数据Z0进行向量绝对值操作,结果存入向量寄存器Z1;S3.4:DSP核的向量处理阵列对上述向量数据Z1与Z2的值进行向量比较操作,将比较结果存入向量寄存器Z3;S3.5:根据上述比较结果值Z3,DSP核的向量处理阵列使用向量MOV操作将Z1中比Z2数值更大的数据值更新向量寄存器Z2;DSP核的向量处理阵列将数值更大的数据所对应存储在Z4中的列元素序号替换存入向量寄存器Z5中;S3.6:DSP核的向量处理阵列使用向量加法操作将向量寄存器Z4的向量数值加p;上述步骤中向量寄存器Z4存储所处理列相对应的列元素序号;重复步骤S3.1至步骤S3.6,直到完成该列的所有元素计算,最终得到p个列元素值以及对应的p个列元素序号值;S3.7:DSP核的向量处理阵列对上述p个列元素值进行数值大小的比较,计算出绝对值最大的列元素值作为列li的列主元,标记为Pi,对应的列元素序号值标记为Vi。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510063817.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top