[发明专利]基于深度学习的不平衡数据的均衡采样及建模方法在审

申请号：	201810637767.3	申请日：	2018-06-20
公开（公告）号：	CN108921208A	公开（公告）日：	2018-11-30
发明（设计）人：	喻梅;邓锐;徐天一;赵满坤;高洁;赵永伟	申请（专利权）人：	天津大学
主分类号：	G06K9/62	分类号：	G06K9/62;G16H50/20
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	杜文茹
地址：	300350 天津市津南区海***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于深度学习的不平衡数据的均衡采样及建模方法：取出数据集中多数类和少数类样本集合，并分别计数；对多数类样集合本进行多次K‑Means聚类，得到R个聚类结果；采用基于关联矩阵的聚类融合算法，将R个聚类结果进行聚类融合，得到新的多数类样集合；对少数类样本集合进行过采样，得到新的少数类样本集合；将得到的新的多数类样集合和新的少数类样本集合相组合，形成类别平衡的新数据集；抽取类别平衡的新数据集的抽象特征，将抽象特征作为一个新的特征加入到类别平衡的新数据集的特征集中，形成新的特征集；采用得到的新的特征集训练DBN模型，得到最优DBN模型。本发明避免了单一处理方法中的缺点，有更好的处理能力，并且有较好的准确率。
搜索关键词：	样本集合新数据聚类集合抽象特征聚类结果特征集采样建模平衡均衡单一处理关联矩阵融合算法数据集中过采样准确率抽取取出融合学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度学习的不平衡数据的均衡采样及建模方法，其特征在于，包括如下步骤：1)取出数据集中多数类和少数类样本集合，并分别计数；2)对多数类样集合本进行多次K‑Means聚类，当最小聚类误差不再变小或者达到指定的迭代次数，停止迭代，此时得到R个聚类结果；3)采用基于关联矩阵的聚类融合算法，将R个聚类结果进行聚类融合，得到新的多数类样集合；4)对少数类样本集合采用smote算法进行过采样，得到新的少数类样本集合；5)将得到的新的多数类样集合和新的少数类样本集合相组合，形成类别平衡的新数据集；6)采用Autoencoder方法抽取类别平衡的新数据集的抽象特征，将抽象特征作为一个新的特征加入到类别平衡的新数据集的特征集中，形成新的特征集；7)采用得到的新的特征集训练DBN模型，得到最优DBN模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810637767.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度学习的不平衡数据的均衡采样及建模方法在审

专利文献下载