[发明专利]一种基于花朵授粉算法优化模糊K近邻的分类方法及装置在审
申请号: | 201710742480.2 | 申请日: | 2017-08-25 |
公开(公告)号: | CN107527071A | 公开(公告)日: | 2017-12-29 |
发明(设计)人: | 马超;于成龙;韩丽屏;关键 | 申请(专利权)人: | 深圳信息职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳中一专利商标事务所44237 | 代理人: | 官建红 |
地址: | 518029 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 花朵 授粉 算法 优化 模糊 近邻 分类 方法 装置 | ||
技术领域
本发明属于计算机技术领域,尤其涉及一种基于花朵授粉算法优化模糊K近邻的分类方法及装置。
背景技术
目前已有的分类方法主要基于人工神经网络、基于贝叶斯网络、基于支持向量机等方法,这些方法都取得了较好的分类效果。其中,基于人工神经网络的方法能够很好地处理非线性数据,因此具有较好的泛化能力,但人工神经网络中的输入层和隐藏层的权重值很难确定,传统采用的梯度下降方法很容易陷入局部极值而找不到全局最优解,参数值较多,需要花费大量时间训练调整。支持向量机使用广泛,其分类结果也较好,这两类是较主流的方法。但是这些模型结构复杂,具有黑箱性质,分类过程缺乏透明度。而模糊K近邻是一种简单、易理解、且能得到较高分类精度的分类方法。相比于人工神经网络,模糊K近邻涉及的参数较少,不需要训练调整那么多输入层和隐藏层的权重值,具有较快的训练速度,基于模糊K近邻的分类精度相比其他方法也更高。
然而,现有研究表明模糊K近邻的性能易受到两个参数的影响,分别是近邻个数和模糊强度系数,近邻个数用于确定其临近样本的数量,所述优化后的模糊强度系数基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度。这两个参数在模型构建和分类时需要提前设定,如何选取最优的近邻个数和最优的模糊强度系数,一直是值得研究的问题,并未得到很好的解决。当前通常采用的方法是通过实验多次尝试设定固定的数值,这种方法设定的值如果设置不当会导致分类精度的降低,难以保证分类模型的分类精度达到最优。
发明内容
本发明的目的在于提供一种基于花朵授粉算法优化模糊K近邻的分类方法及装置,旨在解决现有技术中难以确定模糊K近邻的近邻个数和模糊强度系数,导致模型分类精度不高的问题。
本方面的第一方面,提供基于花朵授粉算法优化模糊K近邻的分类方法,包括:
对获取预定数量的数据样本进行归一化处理;
基于归一化后的所述数据样本,利用花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度;
基于所述优化后的近邻个数k和模糊强度系数m,构建所述模糊K近邻的分类模型;
根据所述分类模型对未分类数据进行分类。
本发明的第二方面,提供一种基于花朵授粉算法优化模糊K近邻的分类装置,包括:
数据归一化模块,用于对给定的数据集进行归一化处理;
花朵授粉优化模块,用于基于归一化后的所述数据,通过花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度;
模型构建模块,用于基于所述优化后的近邻个数k和优化后的模糊强度系数m构建所述模糊K近邻的分类模型;
分类模块,用于根据所述分类模型对未分类数据进行分类。
本发明的第三方面,提供一种计算机终端设备,包括:
存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如前所述基于花朵授粉算法优化模糊K近邻的分类方法的步骤。
本发明的第四方面,提供一种计算机可读存储介质,包括:
所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如前所述基于花朵授粉算法优化模糊K近邻的分类方法的步骤。
本发明与现有技术相比存在的有益效果是:通过将花朵授粉算法融入到模糊K近邻中以确定模糊K近邻的近邻个数和模糊强度系数,由于花朵授粉算法通过模拟自然界中花朵授粉现象设计出的启发式算法,通过异花授粉和自花授粉两种方式的切换权衡全局搜索和局部搜索的比重,从而获得问题的最优解,具有更强的鲁棒性和搜索能力,能够找出模糊K近邻的近邻个数和模糊强度系数的最优值,从而构建出分类精度更高的模糊K近邻分类模型,极大提高分类的准确率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710742480.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预浸装置
- 下一篇:一种废旧塑料瓶用除标装置