[发明专利]一种基于IFCM、KNN和数据字典的集成TSK模糊分类器有效
申请号: | 201910445692.3 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110298382B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 蒋云良;张雄涛;梁荣华;王瑞琴 | 申请(专利权)人: | 湖州师范学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州中利知识产权代理事务所(普通合伙) 33301 | 代理人: | 韩洪 |
地址: | 313000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ifcm knn 数据 字典 集成 tsk 模糊 分类 | ||
本发明公开了一种基于IFCM、KNN和数据字典的集成TSK模糊分类器,依次包括以下步骤:为每个子分类器从Dtr中随机抽样训练数据子集;并行训练L个零阶TSK模糊子分类器;对于验证数据集的每个样本,计算对应的每个输出函数的值并将其作为增强特征,将原始特征和增强特征合并,从而形成增强验证数据集;在增强验证数据集上调用IFCM算法后,生成代表性的中心点及其对应的标签,去掉增强特征,即得到数据字典;对于任何测试样本,利用KNN方法在数据字典上找到最近的k个点,基于投票策略,确定其类标。该分类方法具有较高的分类性能、强鲁棒性和高可解释性。
【技术领域】
本发明涉及模糊识别及机器学习的技术领域,特别是一种基于IFCM、KNN和数据字典的集成TSK快速分类的技术领域。
【背景技术】
由于Takagi-Sugeno-Kang(TSK)模糊分类器强大的逼近能力和高可解释性,在很多领域,如模式识别、智能数据处理和自适应模糊控制等已经得到成功的应用。但是,在一些场景中,比如众包问题,网络图像标识等,我们通常拥有宝贵但少量的真实数据及其标签(在本文中称为验证数据),并且很容易地收集大量原始甚至多源训练数据,通常这些训练数据不可避免的含有噪音数据。但如果在这些训练数据上构建分类模型,其性能将会严重降低。换句话说,用原始训练数据直接训练TSK模糊分类器或集成TSK模糊分类器(即,多个原始训练数据子集)将明显不适合以上考虑的场景,由于以下原因:(1)由于含有噪音的原始训练数据,所训练得到的分类器可能不可靠;(2)现有的TSK模糊分类器的训练算法大多采用对验证数据进行交叉验证策略来确定相关参数,宝贵的验证数据没有得到直接和充分地利用;(3)当采用传统的集成TSK模糊分类器对原始数据进行分类时,由于中间变量的存在,其中的中间子分类器没有可解释性。因此,对于这样的应用场景,希望在充分利用宝贵验证数据的基础上构建一个高性能的集成模糊分类器。
【发明内容】
本发明的目的就是解决现有技术中的问题,提出一种基于IFCM、KNN和数据字典的集成TSK模糊分类器,即IK-D-TSK,具有较高的分类性能、强鲁棒性和高可解释性。
为实现上述目的,本发明提出了一种基于IFCM、KNN和数据字典的集成TSK模糊分类器,依次包括以下步骤:
a)为每个子分类器从Dtr中随机抽样训练数据子集D1,D2,…,DL,并且D1∪D2∪……∪DL=Dtr;
b)并行训练L个零阶TSK模糊子分类器;
c)对于验证数据集的每个样本,计算对应的每个输出函数F1(x),F2(x),…,FL(x)的值并将其作为增强特征,将原始特征和增强特征合并,从而形成增强验证数据集其中表示验证数据的增强特征集,从而生成增强验证数据集;
d)在增强验证数据集上调用IFCM算法后,生成代表性的中心点及其对应的标签,去掉增强特征,即得到数据字典;
e)对于任何测试样本,利用KNN方法在数据字典上找到最近的k个点,基于投票策略,确定其类标。
作为优选,所述步骤b)采用并行学习的思想同时训练L个零阶TSK模糊子分类器,具体包括以下步骤:
b1.为每个子分类器分配模糊规则数;
b2.构造5个高斯型隶属度函数,其隶属度中心点集合为{0,0.25,0.5,0.75,1},在每一维上从中心点集合中随机指定一个值并构造规则组合矩阵通过给每个元素分配一个随机正数来构造核宽度矩阵利用高斯隶属度函数计算模糊隶属度,正则化并构造矩阵
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖州师范学院,未经湖州师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910445692.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置