[发明专利]一种特征筛选方法及装置在审
申请号: | 201610127861.5 | 申请日: | 2016-03-07 |
公开(公告)号: | CN107169571A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 席炎;张柯;谢树坤;黄俊;付子豪;杨强鹏;李文鹏;王晓光;余舟华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 黄熊 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 筛选 方法 装置 | ||
技术领域
本申请涉及计算机技术领域,尤其涉及一种特征筛选方法及装置。
背景技术
目前,人们可以利用构建的业务模型,实现业务功能。这里所说的业务功能,比如是输出表示用户信用等级或用户消费能力的数据,等等。在业务模型构建完毕后,可以将数据赋值给业务模型包含的变量,以触发业务模型输出相应的结果。
需要说明的是,业务模型,一般是指包含“与期望业务模型实现的业务功能相关的变量”的数学模型(比如计算公式)。其中,与期望业务模型实现的业务功能相关的变量,是根据与所述业务功能相关的特征确定的。具体而言,在现有技术中,技术人员可以依靠以往的业务经验,采用人工一一分析特征并进行选取的方式,选取出与所述业务功能比较相关的特征,进而根据该些特征,确定与所述业务功能相关的变量。
例如,以所要构建的业务模型为用户信用评估模型为例,技术人员可以通过一一分析与用户信用相关的特征,选取出与期望该用户信用评价模型实现的业务功能相关的包括用户的工作单位性质、用户的偿还能力以及用户的人脉关系在内的特征,并根据该些特征,确定分别对应于用户的工作单位性质、用户的偿还能力以及用户的人脉关系的变量e、f、g,进而实现业务模型的构建。比如,构建的业务模型可以为:用户信用评价分数A=αe+βf+γg。其中,α、β、γ是分别为变量e、f、g设置的权重值。
采用上述人工选取特征的方式,效率较低。
发明内容
本申请实施例提供一种特征筛选方法,用以解决现有技术存在的特征筛选效率较低的问题。
本申请实施例还提供一种特征筛选装置,用以解决现有技术存在的特征筛选效率较低的问题。
本申请实施例采用下述技术方案:
一种特征筛选方法,包括:
确定特征集合中特征的机器学习算法权值;其中,特征的机器学习算法权值为:以选取作为样本的特征的值为输入,以特征历史上被选取作为确定业务模型包含的变量的特征的概率值为输出训练指定机器学习算法后,得到的机器学习算法的权值;根据所述特征的机器学习算法权值,从所述特征集合中筛选用于确定业务模型包含的变量的特征;所述业务模型包含的变量用于实现业务模型的业务功能。
一种特征筛选装置,包括:
机器学习算法权值确定单元,用于确定特征集合中特征的机器学习算法权值;其中,特征的机器学习算法权值为:以选取作为样本的特征的值作为输入,以特征历史上被选取作为确定业务模型包含的变量的特征的概率值为输出训练指定机器学习算法后,得到的机器学习算法的权值;特征筛选单元,用于根据所述部分或全部特征的机器学习算法权值,从所述特征集合中筛选用于确定业务模型包含的变量的特征;所述业务模型包含的变量用于实现业务模型的业务功能。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
由于可以通过确定特征的机器学习算法权值,并根据机器学习算法权值,实现对用于确定业务模型包含的变量的特征的选取,无需技术人员采用人工筛选的方式选取特征,因此避免了现有技术中采用人工筛选特征的方式导致筛选效率较低的问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种特征筛选方法的具体流程示意图;
图2为本申请实施例提供的一种使用组合机器学习算法对特征进行筛选的流程示意图;
图3为本申请实施例提供的一种筛选用于构建信用评级模型特征的方法的具体流程示意图;
图4为本申请实施例提供的一种特征筛选装置的具体结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
实施例1
本申请实施例提供了一种特征筛选方法,用以解决现有技术存在的特征筛选效率较低的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610127861.5/2.html,转载请声明来源钻瓜专利网。