[发明专利]一种多元离散的特征选择方法、装置、设备及存储介质在审
申请号: | 201810803572.1 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109284766A | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 亢俊皓;周宇;郭海男;林继平 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳青年人专利商标代理有限公司 44350 | 代理人: | 吴桂华 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 粒子 粒子位置 目标数据 最优位置 个体最优位置 种群 存储介质 离散数据 特征选择 粒子群 适应度 分类学习算法 机器学习技术 公式计算 继续执行 冗余特征 停止条件 初始化 正确率 切点 寻优 输出 更新 | ||
1.一种多元离散的特征选择方法,其特征在于,所述方法包括下述步骤:
当接收到对用户输入的目标数据集进行特征选择的请求时,通过最小描述长度算法寻找所述目标数据集中每个特征对应的切点;
根据寻找到的所述切点,对预设数量个粒子的粒子群进行随机初始化,获得所述粒子群中每个粒子的粒子位置,并根据所述粒子位置对所述目标数据集进行数据离散,得到所述目标数据集对应的离散数据集;
根据所述离散数据集,通过预设的适应度公式计算所述每个粒子的适应度,以找到所述粒子群的种群最优位置和所述每个粒子所经过的个体最优位置;
判断是否满足预设的停止条件,是则,输出所述粒子群的种群最优位置,将所述种群最优位置设置为所述目标数据集选择出的特征,否则,根据所述种群最优位置和所述个体最优位置,对所述每个粒子的粒子位置进行更新,并跳转至根据所述粒子位置对所述数据集进行数据离散的步骤。
2.如权利要求1所述的方法,其特征在于,通过最小描述长度算法寻找所述目标数据集中每个特征对应的切点的步骤之前,所述方法还包括:
根据所述目标数据集中目标数据对应特征的特征值,对所述目标数据进行排序,以获得排序后的目标数据集。
3.如权利要求1所述的方法,其特征在于,所述适应度公式为Fitness=μ×balanced_accuracy+(1-μ)distance-β×selection_proportion,其中,balanced_accuracy为平衡分类精度,μ为预设的、平衡分类精度balanced_accuracy的权重系数,distance为所述离散数据集中离散数据间的距离,selection_proportion为特征选择的比例,β为预设的、特征选择比例selection_proportion的权重系数。
4.如权利要求1所述的方法,其特征在于,输出所述粒子群的种群最优位置的步骤之前,所述方法还包括:
当所述种群最优位置达到预设的缩放条件时,增加所述粒子群的粒子数,并跳转至对预设数量个粒子的粒子群进行随机初始化的步骤。
5.一种多元离散的特征选择装置,其特征在于,所述装置包括:
切点寻找单元,用于当接收到对用户输入的目标数据集进行特征选择的请求时,通过最小描述长度算法寻找所述目标数据集中每个特征对应的切点;
初始化及离散单元,用于根据寻找到的所述切点,对预设数量个粒子的粒子群进行随机初始化,获得所述粒子群中每个粒子的粒子位置,并根据所述粒子位置对所述目标数据集进行数据离散,得到所述目标数据集对应的离散数据集;
适应度计算单元,用于根据所述离散数据集,通过预设的适应度公式计算所述每个粒子的适应度,以找到所述粒子群的种群最优位置和所述每个粒子所经过的个体最优位置;以及
停止条件判断单元,用于判断是否满足预设的停止条件,是则,输出所述粒子群的种群最优位置,将所述种群最优位置设置为所述目标数据集选择出的特征,否则,根据所述种群最优位置和所述个体最优位置,对所述每个粒子的粒子位置进行更新,并触发数据离散单元执行根据所述粒子位置对所述数据集进行数据离散的步骤。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
数据排序单元,用于根据所述目标数据集中目标数据对应特征的特征值,对所述目标数据进行排序,以获得排序后的目标数据集。
7.如权利要求5所述的装置,其特征在于,所述适应度公式为Fitness=μ×balanced_accuracy+(1-μ)distance-β×selection_proportion,其中,balanced_accuracy为平衡分类精度,μ为预设的、平衡分类精度balanced_accuracy的权重系数,distance为所述离散数据集中离散数据间的距离,selection_proportion为特征选择的比例,β为预设的、特征选择比例selection_proportion的权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810803572.1/1.html,转载请声明来源钻瓜专利网。