[发明专利]一种基于维度分解的密度聚类类标模式识别方法有效

申请号：	202010904135.6	申请日：	2020-09-01
公开（公告）号：	CN112070140B	公开（公告）日：	2022-05-03
发明（设计）人：	梁少军	申请（专利权）人：	中国人民解放军陆军工程大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	武汉宇晨专利事务所(普通合伙) 42001	代理人：	李鹏;王敏锋
地址：	430075 ***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于维度分解密度聚类类标模式识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于维度分解的密度聚类类标模式识别方法，按照聚类核心点索引集合从训练数据中取出核心点矩阵，取无人机测试数据矩阵中第k个测试数据，求取第k个测试数据的邻近核心点集合，分析第k个测试数据的邻近核心点集合，对第k个测试数据的聚类类标进行识别，遍历无人机测试数据矩阵中的各个测试数据。本发明只需要输入邻域半径，摆脱了算法超参调节的困扰。无需建模且算法开销小。

技术领域

本方法属于模式识别领域，尤其涉及一种基于维度分解的密度聚类类标模式识别方法。

背景技术

密度聚类算法DBSCAN具有能够处理任意形状数据，能够根据数据自身规律自主推断聚类数量，可以自动剔除噪声数据等诸多优点，因此被广泛应用于多个领域。

DBSCAN算法对原始聚类数据(训练数据)完成聚类分析后，会将训练数据分成若干个簇，并用不同的类标标记，即对数据分组。在实际应用中，往往需要判断新的数据(测试数据)属于训练数据中的哪一组，即测试数据的聚类类标模式识别。

常见的模式识别方法有基于相似性(距离)、基于神经网络和基于机器学习的模式识别方法等。其中，基于相似性的模式识别方法根据测试数据与训练数据的空间相似性判断类标，计算开销较大。基于神经网络的模式识别方法需要建模，且模型容易陷入局部最优和过拟合，当数据量增大时计算开销较大。基于机器学习的模式识别方法也需要学习训练数据与类标的规律建模，进而对测试数据类标做出识别，但该类算法存在以下几点问题：1)当数据量增大时计算开销较大；2)容易产生过拟合或欠拟合；3)受到算法超参调优的困扰。常见的基于机器学习的模式识别方法有决策树、判别分析、逻辑回归、朴素贝叶斯、支持向量机、最近邻分类以及集成算法等。

发明内容

本发明所要解决的技术问题是克服现有技术的缺陷，提供一种基于维度分解的密度聚类类标模式识别方法。

本发明方法充分利用了维度分解带来的计算便利，算法中首先基于维度分解执行查找和组合逻辑判断将待处理数据范围缩小，之后再进一步对聚类类标精确识别。算法总体计算开销小，准确度高。

本发明的上述目的通过下述技术方案实现：

一种基于维度分解的密度聚类类标模式识别方法，包括以下步骤：

步骤1、输入聚类后的无人机的训练数据X＝x₁,x₂,…,x_m，其中m为训练数据总数，训练数据的维度为n，

输入训练数据X对应的训练数据类标

输入输入聚类核心点索引集合C和邻域半径Eps，

输入无人机的测试数据T＝t₁,t₂,…,t_p，其中p为测试数据的总数，测试数据的维度为n，

步骤2、按照聚类核心点索引集合C从训练数据X中取出核心点矩阵CX，A^C为核心点矩阵CX中核心点的总数，CX_i表示核心点矩阵CX中第i个核心点，为核心点CX_i的n个维度值，i的范围为[1,A^C]，

步骤3、取无人机测试数据矩阵中第k个测试数据t_k，为测试数据t_k的n个维度值，遍历核心点矩阵CX中所有核心点，若第i个核心点CX_i各维度值满足：

j为核心点的维度序号，j的范围为[1，n]，