[发明专利]一种CPU+GPU群核超算系统及SIFT特征匹配并行计算方法在审
申请号: | 201310296238.9 | 申请日: | 2013-07-15 |
公开(公告)号: | CN103345382A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 肖汉;贾遂民;肖波;冯娜;王永刚 | 申请(专利权)人: | 郑州师范学院 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450044 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 cpu gpu 群核超算 系统 sift 特征 匹配 并行 计算方法 | ||
1.一种CPU+GPU群核超算系统,其特征在于,该CPU+GPU群核超算系统包括CPU单元、北桥芯片单元、系统存储器单元、图形适配器单元:
CPU单元作为主处理器的子系统,用于解释计算机指今以及处理计算机软件中的数据,进行计算;
北桥芯片单元通过前端总线和CPU单元相连,用于提供对CPU的类型和主频、内存的类型和最大容量、ISA/PCI/AGP插槽、ECC纠错支持;
系统存储器单元通过存储器总线和北桥芯片单元相连,用于存储数据的信息;
图形适配器单元通过PCI-Express总线和北桥芯片单元相连,用于控制计算机图形的输出;
GPU模块安装在图形适配器单元上,是图形适配器的核心,用于进行大量的简单并行计算并将数据画成图形;
GPU存储器模块通过DMA操作和GPU模块相连,用于储存收集到的数据。
2.如权利要求1所述的CPU+GPU群核超算系统,其特征在于,CPU为四核的。
3.如权利要求1所述的CPU+GPU群核超算系统,其特征在于,CPU+GPU群核超算系统中包含两个图形适配器。
4.如权利要求1所述的CPU+GPU群核超算系统,其特征在于,软件系统须运行在具有支持CUDA的GeForce8系列以上、Quadro系列的NVIDIA显示适配器的PC机上。
5.一种SIFT特征匹配并行计算方法,其特征在于,该方法的具体过程如下:
步骤一:读取输入影像到主存,将不同尺度的高斯核数据由主存传入到GPU的常数存储器中;
步骤二:利用在GPU中计算的关键点集合信息,启动kernel计算在关键点附近像素的梯度大小和方向;
步骤三:计算128维的SIFT描述符;
步骤四:进行SIFT特征匹配,确定匹配点位。
6.如权利要求5所述的SIFT特征匹配并行计算方法,其特征在于,在GPU中进行分步连续滤波加速高斯尺度空间金字塔的构建,并将高斯金字塔存储在全局存储器内;然后高斯金字塔影像被回读到CPU,相邻尺度的两个高斯影像相减得到DOG金字塔多尺度空间表示;当把候选特征点集合信息上传至GPU中后,便可在GPU内对高斯差分金字塔所有候选特征点进行精确定位,计算关键点周围影像强度的主曲率,通过一个2×2的Hessian矩阵计算特征值比率,检测关键点主曲率是否超过设定的阈值,通过去掉多余的点后,确定关键点集合并精确标记关键点的位置,尺度,关键点位置、尺度将在GPU中恢复。
7.如权利要求5所述的SIFT特征匹配并行计算方法,其特征在于,利用已经存储在全局存储器中的高斯权重函数,对关键点邻域窗口内的各像素的梯度大小进行高斯加权并累加建立方向直方图,检测直方图的峰值,确定关键点主方向。
8.如权利要求5所述的SIFT特征匹配并行计算方法,其特征在于,以关键点为中心的16×16影像数据块根据关键点的尺度、位置和方向构造SIFT描述符的过程在CPU上实现。
9.如权利要求5所述的SIFT特征匹配并行计算方法,其特征在于,确定匹配点位按照原始点的自然顺序将维度数据读入共享存储器,优化的重点是距离计算,保证每个维度差值的平方在同一时刻被计算和维度数目的中间结果的累加方式高效。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州师范学院,未经郑州师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310296238.9/1.html,转载请声明来源钻瓜专利网。