[发明专利]一种基于注意力机制和强化学习的自动特征构造方法在审

专利信息
申请号: 202011171335.1 申请日: 2020-10-28
公开(公告)号: CN112464984A 公开(公告)日: 2021-03-09
发明(设计)人: 何洁月;蔡嘉跃;吴宇 申请(专利权)人: 东南大学
主分类号: G06K9/62 分类号: G06K9/62;G06N7/00;G06N20/00
代理公司: 南京众联专利代理有限公司 32206 代理人: 张天哲
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 机制 强化 学习 自动 特征 构造 方法
【说明书】:

发明公开一种基于注意力机制和强化学习的自动特征构造方法,依次包括以下步骤:步骤1:给定分类问题的数据集DTR,包含一个数值型特征集合S,设置参数最大迭代次数maxIterations,嵌入尺寸embeddingSize的取值;步骤2:将数据集和参数传入该自动特征构造方法,运行得到分类结果。该方法包含基于自注意力机制的特征生成器和基于强化学习的特征选择器,通过迭代不断探索与利用所生成的特征,在有限步骤内以全局最优的特征生成和选择方案指导测试集的特征生成,从而自动得到最优的分类结果。

技术领域

本发明涉及一种自动特征构造方法,具体涉及一种基于注意力机制和强化学习的自动特征构造方法,属于自动机器学习技术领域。

背景技术

近年来自动机器学习本身已成为机器学习的新子领域,机器学习的每个步骤都可以向着自动化方向发展,其中模型选择和超参数优化方面的研究专家们已经提出了比较成熟可用的框架,一般的分类或者回归的机器学习模型已经实现了低门槛或者零门槛甚至免费建模的程度。如今,特征工程是工业界应用AI的难关之一,特征的质量是后续学习模型性能的最重要的基础。

由于原始特征很少会产生令人满意的结果,因此经常需要执行手动特征生成以更好地表示数据并提高学习性能。但是,这通常是繁琐且难以泛化的工作,从而激发了自动特征生成相关的研究工作。大多数自动特征生成的早期工作通过严格预定义的方法经过组合变换来生成特征,使得方法可扩展性差;后来出现基于深度学习的方法以隐式方式学习高阶的特征交叉,但模型又缺乏可解释性。

针对上述存在的问题,本发明提出了一种基于注意力机制和强化学习的自动特征构造方法TideKit。该方法可以自动学习输入特征的高阶相互作用,同时可广泛应用于特征为数值型的分类问题,并且具有良好的模型可解释性。

发明内容

技术问题:

本发明的目的在于解决现有自动特征生成技术中存在的不足,提供一种基于注意力机制和强化学习的自动特征构造方法。

技术方案:

本发明所述的一种基于注意力机制和强化学习的自动特征构造方法,依次包括以下步骤:

(1)给定分类问题的数据集DTR,包含一个数值型特征集合S,设置参数最大迭代次数maxIterations,嵌入尺寸embeddingSize的取值;

(2)将数据集和参数传入TideKit模型,运行模型得到分类结果,该算法的具体内容为:

(21)基于自注意力机制的自动特征生成方法,具体实现于模型的交互层中。对于每个交互层,高阶特征通过自注意力机制进行组合,使用自注意力得分评估不同种类的组合;通过堆叠多个交互层,对组合的原始特征的不同顺序进行建模。

(22)基于强化学习的自动特征选择方法,将特征选择过程转换为马尔可夫决策过程,基于策略梯度并行地评估出每个特征的候选概率,通过迭代不断探索与利用所生成的特征,在有限步骤内以全局最优的特征生成和选择方案指导测试集的特征生成。

进一步的,所述步骤(21)的详细内容为:在模型的特征交互层中,以自注意力得分评估不同种类的特征组合,将其作为特征交互的权重,提供了特征生成阶段的可解释性;以堆叠交互层的形式完成对不同组合顺序的特征交互,提供了特征生成阶段的可扩展性,且该过程是完全自动化的。

进一步的,所述步骤(22)的详细内容为:将特征选择过程转换为马尔可夫决策过程,并且对此过程建立动态的自动调整机制——在元学习阶段根据数据集的特征来预热系统,以及在特征选择的迭代过程中根据期望奖励差的差异化奖励表征,以此优化迭代效率。

有益效果:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011171335.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top