[发明专利]一种多GPU平台上并行双调排序的K-最近邻算法并行优化方法在审
申请号: | 202310398414.3 | 申请日: | 2023-04-14 |
公开(公告)号: | CN116302562A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 王耀彬;莫章彬;唐苹苹;王天海;韩翔宇 | 申请(专利权)人: | 西南科技大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48;G06F18/2413;G06F18/214;G06T1/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 621010 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 gpu 平台 并行 排序 近邻 算法 优化 方法 | ||
1.一种多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,实现K-最近邻算法的并行化过程,以及通过并行化设计实现K-最近邻算法的优化方法包括如下步骤:
步骤一、搭建多GPU平台MGPUSim的系统环境;
步骤二、初始化MGPUSim工作负载与定义内核参数;
步骤三、进行k-最近邻算法的数据预处理;
步骤四、输入常用UCI数据集将测试数据和训练数据集从CPU端拷入GPU;
步骤五、定义基于OpenCL的并行化内核;
步骤六、优化k-最近邻算法的距离计算与距离排序阶段;
步骤七、判断数据进行分类,验证算法分类效果;
步骤八、识别性能瓶颈,验证改进。
2.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,所述的步骤一配置MGPUSim的环境,在MGPUSim平台上编写程序启动函数main(),并创建一个运行程序来初始化多GPU平台。其中的代码包括GPU驱动的模拟引擎和要运行的基准测试。
3.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,步骤二初始化工作负载,创建工作负载构造函数并使用“kernels.LoadProgramMemory”来提取内核执行函数。在内核中定义内核参数,并构造内核执行函数。
4.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,所述的步骤三将算法进行预处理,对样本进行约简处理,同时对临近点引入权值,提升算法的数据处理能力。
5.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,步骤四选取常用的UCI数据集,将测试数据点、训练数据点和k值从CPU端拷贝到GPU端,并在GPU端为数据分配相应的内存空间。
6.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,所述的步骤五基于OpenCL的并行化编程模型定义K-最近邻算法的距离计算和距离排序阶段的并行化内核。
7.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,所述的步骤六通过并行化实现的内核,我们分别对距离计算与距离排序阶段进行优化,在GPU端采用并行双调排序与欧式距离的并行化优化。
8.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,所述的步骤七判断数据进行分类,验证算法分类效果。根据排序结果确定测试数据的分类。
9.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法,其特征在于,所述的步骤八识别性能瓶颈,验证改进。将使用GPU执行轨迹可视化技术识别并行化K-最近邻算法的性能瓶颈,提升K-最近邻算法的性能,包括提高命令处理器的调度速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310398414.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水泵自吸的锁止结构
- 下一篇:一种便携式防磕碰的音乐教学装置