[发明专利]一种多元离散的特征选择方法、装置、设备及存储介质在审
申请号: | 201810803572.1 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109284766A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 亢俊皓;周宇;郭海男;林继平 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳青年人专利商标代理有限公司 44350 | 代理人: | 吴桂华 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用机器学习技术领域,提供了一种多元离散的特征选择方法、装置、设备及存储介质,该方法包括:根据寻找到目标数据集中每个特征对应的切点对粒子群进行初始化,获得每个粒子的粒子位置,根据粒子位置对目标数据集进行数据离散,得到对应的离散数据集,根据离散数据集,通过适应度公式计算每个粒子的适应度,以找到粒子群的种群最优位置和每个粒子所经过的个体最优位置,当满足停止条件时,输出种群最优位置,以作为目标数据集选择出的特征,否则,根据种群最优位置和个体最优位置,更新每个粒子的粒子位置,并继续执行数据离散和寻优的操作,从而实现选择更少的特征,提高冗余特征与无关特征的消除效果,进而提高分类学习算法的正确率。 | ||
搜索关键词: | 粒子 粒子位置 目标数据 最优位置 个体最优位置 种群 存储介质 离散数据 特征选择 粒子群 适应度 分类学习算法 机器学习技术 公式计算 继续执行 冗余特征 停止条件 初始化 正确率 切点 寻优 输出 更新 | ||
【主权项】:
1.一种多元离散的特征选择方法,其特征在于,所述方法包括下述步骤:当接收到对用户输入的目标数据集进行特征选择的请求时,通过最小描述长度算法寻找所述目标数据集中每个特征对应的切点;根据寻找到的所述切点,对预设数量个粒子的粒子群进行随机初始化,获得所述粒子群中每个粒子的粒子位置,并根据所述粒子位置对所述目标数据集进行数据离散,得到所述目标数据集对应的离散数据集;根据所述离散数据集,通过预设的适应度公式计算所述每个粒子的适应度,以找到所述粒子群的种群最优位置和所述每个粒子所经过的个体最优位置;判断是否满足预设的停止条件,是则,输出所述粒子群的种群最优位置,将所述种群最优位置设置为所述目标数据集选择出的特征,否则,根据所述种群最优位置和所述个体最优位置,对所述每个粒子的粒子位置进行更新,并跳转至根据所述粒子位置对所述数据集进行数据离散的步骤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810803572.1/,转载请声明来源钻瓜专利网。