[发明专利]面向向量处理器的SAD向量化实现方法有效
申请号: | 201110213343.2 | 申请日: | 2011-07-28 |
公开(公告)号: | CN102231202A | 公开(公告)日: | 2011-11-02 |
发明(设计)人: | 刘仲;陈书明;刘衡竹;陈跃跃;陈海燕;龚国辉;孙永节;万江华;吴家铸;陈胜刚 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 周长清 |
地址: | 410073 湖南省长沙市开福区砚瓦池正街47号*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 向量 处理器 sad 量化 实现 方法 | ||
1.一种面向向量处理器的SAD向量化实现方法,其特征在于包括以下步骤:
(1)设实时图A,其大小为MxN,模板图为B,其大小为mxn,且M>m,N>n;向量处理器包括P个处理单元;
(2)向量处理器遍历实时图A并存取实时图A中的两个头部间隔4个元素且向量长度为4*p的子图Auv和A(u+4)v,通过混洗操作得到4个头部间隔1个元素且长度为4*p的相邻子图A(u+k)v(k=0,1,2,3);
(3)从模板图B中取1个向量长度为4*p的子图;该子图坐标与子图A(u+k)v(k=0,1,2,3)的坐标位置对应;
(4)分别计算出4个子图A(u+k)v(k=0,1,2,3)与模板图B的SAD系数值ρ(u,v),ρ(u,v+1),ρ(u,v+2),ρ(u,v+3);
(5)令u=u+4,重复上述步骤(2)到步骤(5)直至遍历完实时图A,可以计算得到实时图A与模板图B的所有SAD系数值。
2.根据权利要求1所述的面向向量处理器的SAD向量化实现方法,其特征在于,所述的步骤(4)中ρ(u,v)的计算公式为:
其中aiv=(Auv)iv,(Auv)i(v+1),(Auv)i(v+2),(Auv)i(v+3)为子图Auv中4个8位像素值构成的32位定点向量;biv=(Biv,Bi(v+1),Bi(v+2),Bi(v+3)为模板图B中4个8位像素值构成的32位定点向量,ev=(1,1,1,1)为4个单位像素值构成的32位定点向量,为两个向量的点积;L是循环计数,L=mn/4p;
分别令u=u+k,(k=0,1,2,3),代入上式中,可分别计算得到ρ(u,v),ρ(u,v+1),ρ(u,v+2),ρ(u,v+3)。
3.根据权利要求2所述的面向向量处理器的SAD向量化实现方法,其特征在于,所述是计算aiv,biv两个向量的差的绝对值的和,包括以下4个计算步骤:
①为基于SIMD的减法操作求aiv,biv两个向量的差;
②为基于SIMD的求绝对值操作对步骤①的减法结果分别求绝对值;
③为基于SIMD的点积操作对步骤②的绝对值结果在处理单元内求和;
④为基于向量处理器的定点归约求和操作计算aiv,biv两个向量的差的绝对值的和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110213343.2/1.html,转载请声明来源钻瓜专利网。