[发明专利]特征重要性参数确定方法、装置、设备及可读存储介质在审
申请号: | 202010134253.3 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111368010A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 李诗琦;黄启军;唐兴兴 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/22;G06F16/215;G06N20/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 王韬 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 重要性 参数 确定 方法 装置 设备 可读 存储 介质 | ||
1.一种特征重要性参数确定方法,其特征在于,所述特征重要性参数确定方法包括以下步骤:
根据与各特征对应的特征数据,将与各所述特征数据对应的样本由预设模型的父节点划分到子节点,并基于划分后的各样本确定所述预设模型中各父节点的样本参数和各父节点对应子节点的样本参数;
根据所述预设模型中各父节点的样本参数,以及与各所述父节点对应子节点的样本参数,确定各所述父节点的分类系数;
根据各所述特征分别在各所述父节点上的权重系数,各所述父节点的样本参数和各所述父节点的分类系数,确定各所述特征的重要性参数。
2.如权利要求1所述的特征重要性参数确定方法,其特征在于,各所述父节点的样本参数包括第一基尼系数,各所述子节点的样本参数包括第二基尼系数和第二样本数量;
所述根据所述预设模型中各父节点的样本参数,以及与各所述父节点对应子节点的样本参数,确定各所述父节点的分类系数的步骤包括:
读取各所述父节点的第一基尼系数,并针对各所述父节点执行步骤:
读取与所述父节点对应子节点的第二基尼系数和第二样本数量;
对所述父节点的第一基尼系数,以及各所述子节点的第二样本数量和所述第二基尼系数进行运算,生成所述父节点的分类系数。
3.如权利要求1所述的特征重要性参数确定方法,其特征在于,各所述父节点的样本参数包括第一样本数量,所述根据各所述特征分别在各所述父节点上的权重系数,各所述父节点的样本参数和各所述父节点的分类系数,确定各所述特征的重要性参数的步骤包括:
读取各所述父节点的第一样本数量,并针对各所述父节点执行步骤:
调用各所述特征在所述父节点上的权重系数,分别对所述父节点的分类系数以及所述父节点的第一样本数量加权处理,得到各所述特征在所述父节点中的节点重要性参数;
将各所述特征分别在各所述父节点中的节点重要性参数进行相加,得到各所述特征的重要性参数。
4.如权利要求1所述的特征重要性参数确定方法,其特征在于,所述确定各所述特征的重要性参数的步骤之后,所述方法还包括:
将各所述特征的重要性参数和预设阈值对比,确定各所述特征的重要性参数中大于预设阈值的目标重要性参数;
查找与各所述目标重要性参数对应的特征作为有效特征。
5.如权利要求1所述的特征重要性参数确定方法,其特征在于,所述根据与各特征对应的特征数据,将与各所述特征数据对应的样本由预设模型的父节点划分到子节点的步骤包括:
从所述预设模型的各父节点中查找出初始父节点作为待划分父节点,并确定各所述特征在所述待划分父节点上的权重系数;
根据各所述特征在所述待划分父节点上的权重系数,以及与各所述特征对应的特征数据,生成与各所述特征数据对应的样本在所述待划分父节点中的样本值;
根据各所述样本值,将与各所述特征数据对应的样本由所述待划分父节点划分到与所述待划分父节点对应的子节点中;
将与所述待划分父节点对应的子节点作为新的待划分父节点,执行确定所述预设模型的待划分父节点中与各所述特征对应的权重系数的步骤,直到与所述待划分父节点对应的子节点为叶子节点。
6.如权利要求1-5任一项所述的特征重要性参数确定方法,其特征在于,所述基于划分后的各样本确定所述预设模型中各父节点的样本参数和各父节点对应子节点的样本参数的步骤包括:
统计经由各所述父节点划分的样本的第一样本数量,并根据各所述父节点中样本的类别,确定各所述父节点的第一基尼系数,将各所述父节点的所述第一样本数量和第一基尼系数确定为各所述父节点的样本参数;
统计划分到各所述子节点的样本的第二样本数量,并根据各所述子节点中样本的类别,确定各所述子节点的第二基尼系数,将各所述子节点的所述第二样本数量和第二基尼系数确定为各所述子节点的样本参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010134253.3/1.html,转载请声明来源钻瓜专利网。