[发明专利]一种基于类别均衡的代表样本发现方法在审
申请号: | 201711316558.0 | 申请日: | 2017-12-12 |
公开(公告)号: | CN108062563A | 公开(公告)日: | 2018-05-22 |
发明(设计)人: | 袁玉波;顾依依;谈询滔;阮彤 | 申请(专利权)人: | 华东理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200237 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本方法公开了一种基于类别均衡的代表样本发现方法。在确保智能分类系统分类准确率的条件下,以提升机器学习的效率为目标。本方法核心技术包括:第一、候选样本集合预处理及分割方法,将用户给出的数据库进行预处理,包括缺失值、异常值的处理和数据集合预切割;第二、代表样本数量分配,给出类别均衡的定义并分配代表样本个数;第三、多标准选择代表,按照最大、最小和平均三种标准进行选举代表样本工作。此方法在保持分类准确率基本不变的情况下,有效地减少智能分类系统建模时间和内存空间。为了验证方法有效性,选择了5类智能分类算法在25个UCI数据库上展开试验,结果说明本方法选择得到了有意义的代表样本。 | ||
搜索关键词: | 一种 基于 类别 均衡 代表 样本 发现 方法 | ||
【主权项】:
1.一种基于类别均衡的代表样本发现方法,其特征在于:对数据分类训练数据库进行样本发现工作时,进行了以下步骤,步骤1,候选集合分割:对输入的数据库进行预处理,包括缺失值、异常值的处理和数据集合预切割;步骤2,代表样本数量分配:给出类别均衡的定义,并根据用户给定的所需选取的代表样本个数,确定每个类别中应选出的代表样本个数;步骤3,代表样本选择:根据每个类别应选的代表个数,在相应的类别子集中,按照三种标准进行样本发现工作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711316558.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种显示方法、装置及移动终端
- 下一篇:水槽式清洗机的透气机构