[发明专利]基于CUDA的格网数字高程模型邻域分析的系统和方法有效
申请号: | 201210344622.7 | 申请日: | 2012-09-17 |
公开(公告)号: | CN102880509A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 高勇;郁浩;刘磊;李浩然 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F9/46 | 分类号: | G06F9/46 |
代理公司: | 北京万象新悦知识产权代理事务所(普通合伙) 11360 | 代理人: | 苏爱华 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cuda 数字 高程 模型 邻域 分析 系统 方法 | ||
1.一种基于CUDA的格网数字高程模型邻域分析的系统,包括:数据IO模块、函数调度模块、核函数模块、邻域分析算子,其特征是,
所述数据IO模块,独占一个线程,该线程称为IO线程,提供数据读写支持;
所述函数调度模块,负责协调数据的IO线程和CUDA核函数的执行;该模块开辟出多个内存块用作缓冲区,同时启动多个线程,一个线程负责数据IO,即IO线程;其余线程称为worker线程,其个数与主机的GPU数量一致,每个worker线程对应一个GPU;
所述核函数模块,负责将数据从内存缓冲区中拷贝到GPU 芯片的存储器上,调用CUDA核函数对数据进行计算,并在计算结束后将数据从GPU芯片的存储器拷贝到内存中;
所述邻域分析算子,被核函数模块调用,用以执行邻域分析中单个邻域模板的数据计算;所述邻域分析算子对外以函数接口提供,由系统使用者实现。
2.如权利要求1所述的格网数字高程模型邻域分析的系统,其特征是,系统的使用者通过注册不同的数据驱动引擎,从不同数据源读取数据,并以二维矩阵的形式在内存缓冲区中存储。
3.如权利要求2所述的格网数字高程模型邻域分析的系统,其特征是,所述数据源包括文件系统、数据库、网络。
4.如权利要求2所述的格网数字高程模型邻域分析的系统,其特征是,从数据源读取数据的时候,按照设定好的分块大小,分块读取数据源的数据,如果输入文件小于设定的块大小,则一次将数据全部读入内存中;如果原始数据很大,大于设定的大小,则按照设定的分块大小读取数据。
5.如权利要求1所述的格网数字高程模型邻域分析的系统,其特征是,所述函数调度模块,采用生产者-消费者模型来调度数据IO函数和CUDA核函数,数据IO线程充当生产者,将输入文件中的原始DEM数据读取到缓冲区中;worker线程充当消费者,处理缓冲区中的数据,并把处理后的结果数据更新到缓冲区中;当数据IO线程向一个缓冲区写完数据后,会触发一个worker线程来消费缓冲区中的数据,并把结果数据更新缓冲区中;当一个worker线程将结果写回缓冲区后,也会触发数据IO线程,将缓冲区的数据写到输出文件,同时再从输入文件读取另一部分数据给缓冲区模块,形成循环;当没有数据可读时,数据IO模块会在缓冲区中标记数据读完毕,并停止执行,消费者线程看到这个标记也会停止执行。
6.如权利要求1所述的格网数字高程模型邻域分析的系统,其特征是,所述核函数模块,负责将数据从内存传输到显卡存储器,调用邻域分析算子,再将结果从显卡存储器写回内存;包括:
核函数将GPU存储器上的数据分割成块,每块被分到一个block的线程中,每块的大小和block中的线程数对应;一个block中的线程按照接合的特点从GPU存储器中读取数据,然后每个线程执行一个邻域分析算子操作;同一个block中的不同线程执行的模板操作指令是一样的,这样让一个block中的不同线程尽可能共享指令前段;每个block中的线程不是从数据块的边缘计算,而是从与边缘相距邻域模板算子一半的距离计算;在调用邻域分析算子计算结束后,计算结果会写回GPU存储器中,然后再从GPU存储器写回内存的缓冲区中。
7.如权利要求1所述的格网数字高程模型邻域分析的系统,其特征是,所述邻域分析算子,是一个邻域计算的函数接口,系统使用者根据需求实现不同的函数,并以函数指针的形式向CUDA核函数注册,每一个CUDA线程具体执行邻域分析算子的操作。
8.如权利要求7所述的格网数字高程模型邻域分析的系统,其特征是,注册函数包含邻域算子模板的长、宽、邻域算子的函数指针;邻域算子函数的输入参数是矩阵的起始位置、目标点的行数、目标点的列数、矩阵总行数、矩阵总列数,输出为该点经过邻域计算后的结果值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210344622.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无线IC卡智能读卡机
- 下一篇:一种部分解耦的平面三自由度并联精密定位平台