[发明专利]面向GPDSP的矩阵LU分解向量化计算的方法有效
申请号: | 201510063817.8 | 申请日: | 2015-02-06 |
公开(公告)号: | CN104636315B | 公开(公告)日: | 2017-12-22 |
发明(设计)人: | 刘仲;陈书明;郭阳;陈海燕;田希;陈磊;胡封林;刘蓬侠;刘胜;雷元武;扈啸;陈跃跃;王耀华 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F13/28 |
代理公司: | 湖南兆弘专利事务所(普通合伙)43008 | 代理人: | 周长清 |
地址: | 410073 湖南省长沙市砚瓦池正*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种面向GPDSP的矩阵LU分解向量化计算的方法,其步骤为S1根据GPDSP的体系结构特征确定最佳的LU分解的矩阵规模N值;S2DSP核通过DMA从片外DDR存储器将要处理的矩阵数据传输到片内共享存储阵列中;S3DSP核按照列选主元方法,计算第i列的主元值以及对应的列元素序号值;S4根据列li的列主元Pi以及对应的列元素序号值Vi对矩阵A内列主元Pi所在的行与列首元l[i]所在的行进行交换;S5DSP核对列li按照公式li=li/l[i]进行列消元计算,更新列li;S6DSP核进行更新矩阵panel的计算;S7判断i是否等于N‑1,若不是,令i=i+1,转步骤S3,若是转步骤S8;S8计算完毕。本发明能充分利用DSP核向量处理阵列的强大并行计算、高带宽向量数据加载能力,显著提高DSP核计算访存比。 | ||
搜索关键词: | 面向 gpdsp 矩阵 lu 分解 量化 计算 方法 | ||
【主权项】:
一种面向GPDSP的矩阵LU分解向量化计算的方法,其特征在于,步骤为:S1:根据GPDSP的体系结构特征确定最佳的LU分解的矩阵规模N值;S2:GPDSP的DSP核通过DMA从片外DDR存储器将需要处理的矩阵数据传输到片内共享存储阵列中;S3:GPDSP的DSP核按照列选主元方法,计算第i列的主元值以及对应的列元素序号值,初始i=0;S4:GPDSP的DSP核根据上述计算得到的列li的列主元Pi以及对应的列元素序号值Vi对矩阵A内列主元Pi所在的行与列首元l[i]所在的行进行交换;S5:GPDSP的DSP核对列li按照公式li=li/l[i]进行列消元计算,更新列li;在所述步骤S5中,将片内共享存储阵列矩阵A中,列首元l[i]右下方的矩阵记为L’i,矩阵A中第i行位于上三角C的部分记为ui,列首元l[i]右方包括ui部分的矩阵记为Li,列li不包括列首元l[i]的部分记为列l’i;S6:GPDSP的DSP核按照L’i=L’i‑l’i*ui进行更新矩阵panel的计算;S7:判断i是否等于N‑1,若不是,令i=i+1,转步骤S3,若是转步骤S8;S8:矩阵A的LU分解计算完毕;DSP核使用DMA将矩阵A从片内共享存储阵列传输到片外DDR存储器的原存储位置;所述步骤S3的详细流程为:S3.1:DSP核通过DMA将列li从片内共享存储阵列中传输至片内向量阵列存储器;设初始值为全0的向量寄存器Z2和向量寄存器Z5,以及初始值为{0,1,2,…,p‑1}的向量寄存器Z4;S3.2:DSP核的向量处理阵列依次通过向量LOAD指令加载p个元素,存入向量寄存器Z0;S3.3:DSP核的向量处理阵列对上述向量数据Z0进行向量绝对值操作,结果存入向量寄存器Z1;S3.4:DSP核的向量处理阵列对上述向量数据Z1与Z2的值进行向量比较操作,将比较结果存入向量寄存器Z3;S3.5:根据上述比较结果值Z3,DSP核的向量处理阵列使用向量MOV操作将Z1中比Z2数值更大的数据值更新向量寄存器Z2;DSP核的向量处理阵列将数值更大的数据所对应存储在Z4中的列元素序号替换存入向量寄存器Z5中;S3.6:DSP核的向量处理阵列使用向量加法操作将向量寄存器Z4的向量数值加p;上述步骤中向量寄存器Z4存储所处理列相对应的列元素序号;重复步骤S3.1至步骤S3.6,直到完成该列的所有元素计算,最终得到p个列元素值以及对应的p个列元素序号值;S3.7:DSP核的向量处理阵列对上述p个列元素值进行数值大小的比较,计算出绝对值最大的列元素值作为列li的列主元,标记为Pi,对应的列元素序号值标记为Vi。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510063817.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种海量类定位数据存储方法
- 下一篇:基于机器视觉的矩阵识别方法