[发明专利]基于构造等边平衡三角形SMOTE算法的少数类样本生成方法有效
申请号: | 202110619809.2 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113379823B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 徐玲玲;迟东祥;支文俊;徐迁凤;黄彦乾 | 申请(专利权)人: | 上海电机学院 |
主分类号: | G06T7/60 | 分类号: | G06T7/60;G06T3/40;G06V10/77;G06K9/62 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 构造 等边 平衡 三角形 smote 算法 少数 样本 生成 方法 | ||
1.一种基于构造等边平衡三角形SMOTE算法的少数类样本生成方法,其包括:
(S1)从数据集中获取少数类样本集S,确定参与生成少数类样本的最近邻样本的个数k,并确定距离阈值ε;
(S2)计算少数类样本集S中各少数类样本的均值向量μ0;
(S3)计算少数类样本集S中各少数类样本与均值向量μ0的巴氏距离,获取巴氏距离最小的少数类样本Xj;
(S4)搜寻少数类样本集S中其他少数类样本,将与少数类样本Xj的巴氏距离Bki小于距离阈值ε的少数类样本添加至待定参与少数类样本生成的样本集G,直到样本集G中的样本个数等于k或者少数类样本集S搜寻完成;
(S5)将样本集G中的各样本之间两两连线,以各连接线为边分别构造等边三角形,并以各等边三角形的中点为新生成的少数类样本。
2.根据权利要求1所述的一种基于构造等边平衡三角形SMOTE算法的少数类样本生成方法,其特征在于,步骤(S5)中以连接线为边分别构造等边三角形的过程中,若样本的维度大于二,使用主成分分析技术将样本降维至二维,并在二维情况下构造等边三角形并生成新的少数类样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电机学院,未经上海电机学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110619809.2/1.html,转载请声明来源钻瓜专利网。