[发明专利]一种多GPU平台上并行双调排序的K-最近邻算法并行优化方法在审

申请号：	202310398414.3	申请日：	2023-04-14
公开（公告）号：	CN116302562A	公开（公告）日：	2023-06-23
发明（设计）人：	王耀彬;莫章彬;唐苹苹;王天海;韩翔宇	申请（专利权）人：	西南科技大学
主分类号：	G06F9/50	分类号：	G06F9/50;G06F9/48;G06F18/2413;G06F18/214;G06T1/20
代理公司：	暂无信息	代理人：	暂无信息
地址：	621010 四川***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种 gpu 平台并行排序近邻算法优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，实现K-最近邻算法的并行化过程，以及通过并行化设计实现K-最近邻算法的优化方法包括如下步骤：

步骤一、搭建多GPU平台MGPUSim的系统环境；

步骤二、初始化MGPUSim工作负载与定义内核参数；

步骤三、进行k-最近邻算法的数据预处理；

步骤四、输入常用UCI数据集将测试数据和训练数据集从CPU端拷入GPU；

步骤五、定义基于OpenCL的并行化内核；

步骤六、优化k-最近邻算法的距离计算与距离排序阶段；

步骤七、判断数据进行分类，验证算法分类效果；

步骤八、识别性能瓶颈，验证改进。

2.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，所述的步骤一配置MGPUSim的环境，在MGPUSim平台上编写程序启动函数main()，并创建一个运行程序来初始化多GPU平台。其中的代码包括GPU驱动的模拟引擎和要运行的基准测试。

3.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，步骤二初始化工作负载，创建工作负载构造函数并使用“kernels.LoadProgramMemory”来提取内核执行函数。在内核中定义内核参数，并构造内核执行函数。

4.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，所述的步骤三将算法进行预处理，对样本进行约简处理，同时对临近点引入权值，提升算法的数据处理能力。

5.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，步骤四选取常用的UCI数据集，将测试数据点、训练数据点和k值从CPU端拷贝到GPU端，并在GPU端为数据分配相应的内存空间。

6.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，所述的步骤五基于OpenCL的并行化编程模型定义K-最近邻算法的距离计算和距离排序阶段的并行化内核。

7.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，所述的步骤六通过并行化实现的内核，我们分别对距离计算与距离排序阶段进行优化，在GPU端采用并行双调排序与欧式距离的并行化优化。

8.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，所述的步骤七判断数据进行分类，验证算法分类效果。根据排序结果确定测试数据的分类。

9.如权利要求1所述的多GPU平台上并行双调排序的K-最近邻算法并行优化方法，其特征在于，所述的步骤八识别性能瓶颈，验证改进。将使用GPU执行轨迹可视化技术识别并行化K-最近邻算法的性能瓶颈，提升K-最近邻算法的性能，包括提高命令处理器的调度速度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西南科技大学，未经西南科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310398414.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载