[发明专利]一种针对非均衡数据的层次化赋权分类方法及系统在审
申请号: | 202111021991.8 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113705705A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 杨晓东;陈益强 | 申请(专利权)人: | 山东产业技术研究院智能计算研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250000 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 均衡 数据 层次 化赋权 分类 方法 系统 | ||
1.一种针对非均衡数据的层次化赋权分类方法,其特征是,包括:
类内子概念簇权重学习步骤:对训练样本进行层次聚类,根据聚类结果中各簇包含的样本数量计算各簇的样本权重,以使各子概念簇的数量权重总和保持一致并计算各子概念簇的类内权重;
全局权重归一化步骤:根据一定的类间权重比率,将类内权重归一化至全局权重,并以此构建带权重的支持向量机作为分类器,利用该分类器对输入的带识别的非均衡数据进行分类。
2.如权利要求1所述的一种针对非均衡数据的层次化赋权分类方法,其特征是,对训练样本进行层次聚类,具体为:
获取带标签的训练数据;
针对每个类别,采用层次聚类方法进行类别无监督聚类,获得类别内子概念簇;
基于各簇间的样本数量计算数量权重,基于各簇与对立类间距离计算距离权重;
基于数量权重和距离权重计算子概念簇的类内权重。
3.如权利要求1所述的一种针对非均衡数据的层次化赋权分类方法,其特征是,利用渐进式二分查找法确定最优的类间权重比率。
4.如权利要求1所述的一种针对非均衡数据的层次化赋权分类方法,其特征是,所述子概念簇的类内权重计算过程为:
在针对每个类别样本进行无监督层次聚类后,假设得到k个子概念簇,各簇的数量表示为n1,n2,…,nk;
以簇为单位进行赋权,针对每个类别,子概念簇的类内权重表示为Wc1,Wc2,…,Wck,每个子概念簇的权重与其所包含的样本数量和于对立类的距离相关,具体可表示为:
Wci=Wni·Wdi
其中,Wni表示第i簇的数量权重,Wdi表示第i簇与对立类的距离权重。
5.如权利要求1所述的一种针对非均衡数据的层次化赋权分类方法,其特征是,数量权重Wni可以按照以下公式计算:
将Wni归一化至(0,1]。
6.如权利要求1所述的一种针对非均衡数据的层次化赋权分类方法,其特征是,距离权重计算过程为:
每个子概念簇与对立类的距离采用与对立类各子概念的最小距离作为度量:
其中,dis(*)表示距离度量公式,本发明中采用欧式距离作为度量,ci表示当前子概念簇,c’k表示对立类第k个子概念簇。
采用Min-Max方法将距离归一化至(0,1];
距离权重可按照以下公式计算:
7.如权利要求1所述的一种针对非均衡数据的层次化赋权分类方法,其特征是,针对类间非均衡,将各簇学习权重按照一定的类间权重比率进行归一化,假设一个类别的权重占总权重的百分比为p,则其各子概念簇的全局权重可按照以下公式进行归一化,
8.一种针对非均衡数据的层次化赋权分类系统,其特征是,包括:
类内子概念簇权重学习模块,被配置为:对训练样本进行层次聚类,根据聚类结果中各簇包含的样本数量计算各簇的样本权重,以使各子概念簇的数量权重总和保持一致并计算各子概念簇的类内权重;
全局权重归一化模块,被配置为:根据一定的类间权重比率,将类内权重归一化至全局权重,并以此构建带权重的支持向量机作为分类器,利用该分类器对输入的带识别的非均衡数据进行分类。
9.一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现上述权利要求1-7任一所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征是,该程序被处理器执行时执行上述权利要求1-7任一所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东产业技术研究院智能计算研究院,未经山东产业技术研究院智能计算研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111021991.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:输送装置
- 下一篇:一种中西医结合心血管内科临床诊治装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置