[发明专利]实现自动机器学习的方法和装置在审
申请号: | 201910618238.3 | 申请日: | 2019-07-10 |
公开(公告)号: | CN111178535A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 胡毅奇;涂威威 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 曾世骁;朱志玲 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 自动 机器 学习 方法 装置 | ||
公开了一种实现自动机器学习的方法和装置,所述方法包括:获取针对目标数据集进行自动机器学习时采样的候选模型配置;对于获取到的候选模型配置中的至少部分候选模型配置中的每一个候选模型配置,利用第一保真度评价方法对该候选模型配置进行评价得到第一评价值,利用评价值残差预测器预测该候选模型配置的所述第一评价值与第二评价值之间的差值,并用该差值修正第一评价值来得到与该候选模型配置对应的修正后的评价值,其中,所述第二评价值指利用第二保真度评价方法对该候选模型配置进行评价时应得的评价值,第二保真度评价方法的保真度比第一保真度评价方法的保真度高;基于各候选模型配置对应的评价值,为目标数据集选择一个候选模型配置。
技术领域
本申请要求申请号为201811339342.0,申请日为2018年11月12日,名称为“实现自动机器学习的方法和装置”的中国专利申请的优先权。本申请总体说来涉及人工智能领域,更具体地讲,涉及一种实现自动机器学习的方法和装置。
背景技术
随着海量数据的出现,人工智能技术迅速发展,而机器学习是人工智能发展到一定阶段的必然产物,其致力于通过计算的手段,从大量数据中挖掘有价值的潜在信息。通常,机器学习过程中所涉及的许多工作(例如,模型算法选择、超参数调整等)往往既需要具备计算机(特别是机器学习)专业知识,也需要具备与预测场景相关的具体业务经验,因此,需要耗费大量的人力成本。为了提高机器学习效率,近年来提出了自动机器学习技术,其可在没有人力参与的情况下,针对具体机器学习问题,自动进行模型算法选择和超参数优化,得到最优的模型配置,因此,大大降低了机器学习门槛并且降低了用于机器学习的人力成本。其中,基于自动机器学习技术所产生的模型可被应用于图像处理场景、语音识别场景、自然语言处理场景、自动控制场景、智能问答场景、业务决策场景、推荐业务场景、搜索场景或异常行为检测场景。
然而,要得到最优的模型,自动机器学习过程中需要不断对采样的模型配置进行优化,为此,需要对采样的模型配置进行评价。通常,最简单的评价方式有以下两种形式:一种是高保真度评价,此种评价精准(即,保真度高),但是获得此种评价的代价(例如,计算量)很大;另一种是低保真度评价,此种评价和准确评价之间存在误差(即,保真度低),但是评价代价小。
虽然目前存在基于树结构搜索算法的多保真度评价优化方法,但是这样的方法始终基于随着优化的进程保真度越来越高的假设(然而,实际优化过程中并不必然满足这种假设,例如,某些非迭代式优化机器学习模型的过程便不满足这种假设),并且往往利用优化方法的结构预先对低保真度评价的误差做出假设(然而,不同采样样本之间常存在差异,故这种固定假设会导致评价值修正不够准确)。此外,这样的方法强依赖于优化算法本身,并且随着树结构的深度增大,评价代价越来越高,而并没能很好的解决自动机器学习中评价开销大的问题。
鉴于此,需要既可以提高评价值修正的准确性又可以降低自动机器学习过程中的评价代价以提高优化效率的自动机器学习技术。
发明内容
根据本申请示例性实施例,提供了一种实现自动机器学习的方法,所述方法可包括:获取针对目标数据集进行自动机器学习时采样的候选模型配置,其中,一个候选模型配置包括确定的机器学习算法和一组超参数;对于获取到的候选模型配置中的至少部分候选模型配置中的每一个候选模型配置,通过以下方式得到与该候选模型配置对应的修正后的评价值:利用第一保真度评价方法对该候选模型配置进行评价得到第一评价值,利用评价值残差预测器预测出该候选模型配置的所述第一评价值与第二评价值之间的差值,并用该差值修正所述第一评价值来得到与该候选模型配置对应的修正后的评价值,其中,所述第二评价值指利用第二保真度评价方法对该候选模型配置进行评价时应得的评价值,第二保真度评价方法的保真度比第一保真度评价方法的保真度高;基于各候选模型配置对应的评价值,为所述目标数据集选择一个候选模型配置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910618238.3/2.html,转载请声明来源钻瓜专利网。