[发明专利]一种用于机器学习的特征处理方法和系统在审

专利信息
申请号: 201911065763.3 申请日: 2019-11-04
公开(公告)号: CN110781978A 公开(公告)日: 2020-02-11
发明(设计)人: 马健;钟文亮 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/12;G06N20/00
代理公司: 51253 成都七星天知识产权代理有限公司 代理人: 杨永梅
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 算子 基础特征 机器学习 目标特征 遗传规划算法 初始种群 候选特征 特征组合 种群 特征处理 遗传操作 特征集 运算 优化
【说明书】:

本实施例之一涉及一种用于机器学习的特征处理方法和系统。所述方法包括:从基础特征集中获取多个候选特征以及从基础算子集中获取多个候选算子,将所述多个候选特征和多个候选算子组成多个初始特征组合;将所述多个初始特征组合作为遗传规划算法的初始种群,采用遗传规划算法对所述初始种群进行遗传操作,得到优化后的目标种群;基于所述优化后的目标种群得到目标特征组合,所述目标特征组合用基础特征和基础算子的计算结果来表示;其中基础特征属于基础特征集,基础算子属于基础算子集;将所述目标特征组合作为机器学习的一个特征参与机器学习的运算。

技术领域

本说明书实施例涉及人工智能领域,特别涉及一种用于机器学习的特征处理方法和系统。

背景技术

特征是所有机器学习模型的基础,好的特征对模型的效果起到至关重要的作用。单个特征的表达能力往往有限,将多个特征进行组合可以提高表达能力。特征挖掘本身是一项较为繁琐的工作,通过人工挖掘得到的特征组合往往只有3-4阶,其他的一些自动挖掘特征组合的方法得到的特征组合为隐式特征组合,这样的特征组合与目标变量之间的关系非常隐蔽,可解释性较低,或者,得到的特征组合为半显式特征组合,这样的特征组合与目标变量之间的关系虽然不像隐式特征组合那样隐蔽,但其表达能力有限。

因此,希望能提供一种能够有效挖掘显式特征组合的方法和系统。

发明内容

本说明书中实施例提供一种用于机器学习的特征处理方法,包括:从基础特征集中获取多个候选特征以及从基础算子集中获取多个候选算子,将所述多个候选特征和多个候选算子组成多个初始特征组合;将所述多个初始特征组合作为遗传规划算法的多个初始种群,采用遗传规划算法对所述多个初始种群进行遗传操作,得到优化后的目标种群;基于所述优化后的目标种群得到目标特征组合,所述目标特征组合用基础特征和基础算子的计算结果来表示;其中基础特征属于基础特征集,基础算子属于基础算子集;将所述目标特征组合作为机器学习的一个特征参与机器学习的运算。

本说明书实施例提供一种用于机器学习的特征处理系统,包括:获取模块,用于从基础特征集中获取多个候选特征以及从基础算子集中获取多个候选算子;初始特征组合生成模块,用于将所述多个候选特征和多个候选算子组成多个初始特征组合;遗传规划模块,用于将所述多个初始特征组合作为遗传规划算法的初始种群,采用遗传规划算法对所述初始种群进行遗传操作,得到优化后的目标种群;目标特征组合确定模块,用于基于所述优化后的目标种群得到目标特征组合,所述目标特征组合用基础特征和基础算子的计算结果来表示;其中基础特征属于基础特征集,基础算子属于基础算子集;所述目标特征组合能够作为机器学习的一个特征参与机器学习的运算。

本说明书实施例提供一种用于机器学习的特征处理装置,所述装置包括至少一个处理器以及至少一个存储器;所述至少一个存储器用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如上所述的特征处理方法。

附图说明

本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:

图1为根据本说明书一些实施例所示的特征处理方法的示例性流程图;

图2为根据本说明书一些实施例所示的示例性树编码形式的特征树;

图3为根据本说明书一些实施例所示的通过遗传规划算法确定目标种群的示例性流程图;

图4为根据本说明书一些实施例所示的基因交叉的一个示意图;

图5为根据本说明书一些实施例所示的基因突变的一个示意图;以及

图6为根据本申请一些实施例所示的特征处理系统的示例性框图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911065763.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top