[发明专利]实现自动机器学习的方法和装置在审
申请号: | 201910618238.3 | 申请日: | 2019-07-10 |
公开(公告)号: | CN111178535A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 胡毅奇;涂威威 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 曾世骁;朱志玲 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 自动 机器 学习 方法 装置 | ||
1.一种实现自动机器学习的方法,包括:
获取针对目标数据集进行自动机器学习时采样的候选模型配置,其中,一个候选模型配置包括确定的机器学习算法和一组超参数;
对于获取到的候选模型配置中的至少部分候选模型配置中的每一个候选模型配置,通过以下方式得到与该候选模型配置对应的修正后的评价值:利用第一保真度评价方法对该候选模型配置进行评价得到第一评价值,利用评价值残差预测器预测出该候选模型配置的所述第一评价值与第二评价值之间的差值,并用该差值修正所述第一评价值来得到与该候选模型配置对应的修正后的评价值,其中,所述第二评价值指利用第二保真度评价方法对该候选模型配置进行评价时应得的评价值,第二保真度评价方法的保真度比第一保真度评价方法的保真度高;
基于各候选模型配置对应的评价值,为所述目标数据集选择一个候选模型配置。
2.如权利要求1所述的方法,其中,该方法在利用评价值残差预测器进行预测之前还包括初始化所述评价值残差预测器的步骤,该步骤包括:
获取针对目标数据集进行自动机器学习时随机采样的至少一个候选模型配置;
分别利用第一保真度评价方法和第二保真度评价方法对所述至少一个候选模型配置中的每个候选模型配置进行评价,以获得与每个候选模型配置对应的第一评价值和第二评价值;
将所述至少一个候选模型配置中的每个候选模型配置作为样本数据并将该候选模型配置的第二评价值和第一评价值的差值作为该样本数据的标记,构建用于训练所述评价值残差预测器的训练样本,并基于构建的训练样本来训练所述评价值残差预测器。
3.如权利要求1所述的方法,其中,获取针对目标数据集进行自动机器学习时采样的候选模型配置,以及对于获取到的候选模型配置中的至少部分候选模型配置中的每一个候选模型配置,得到与该候选模型配置对应的修正后的评价值包括:
每当采样到一个候选模型配置,利用第一保真度评价方法对该当前候选模型配置进行评价得到第一评价值,并利用评价值残差预测器预测出该当前候选模型配置的第一评价值与第二评价值之间的差值,用该差值修正第一评价值来得到与该当前候选模型配置对应的修正后的评价值;
至少基于该当前候选模型配置对应的修正后的评价值,采样新的候选模型配置。
4.如权利要求3所述的方法,其中,该方法进一步包括:
每当获取到第一预设值个数的候选模型配置以及各自对应的修正后的评价值后,从该第一预设值个数的候选模型配置中选择一个候选模型配置;
利用第二保真度评价方法对所选择的该候选模型配置进行评价得到该候选模型的第二评价值,将该候选模型配置作为样本数据并将该候选模型配置的第二评价值和第一评价值的差值作为该样本数据的标记,构建一条用于训练所述评价值残差预测器的新训练样本;
至少基于构建的新训练样本训练所述评价值残差预测器,得到更新后的评价值残差预测器;
利用更新后的评价值残差预测器预测后续采样到的候选模型配置对应的第二评价值与第一评价值之间的差值,进而得到相应的修正后的评价值;
当所述评价值残差预测器被更新第二预设值次数后,停止采样新的候选模型配置。
5.如权利要求4所述的方法,其中,
所述从该第一预设值个数的候选模型配置中选择一个候选模型配置包括:从该第一预设值个数的候选模型配置中选择对应的修正后的评价值最高/最低的一个候选模型配置;
所述基于各候选模型配置对应的评价值,为所述目标数据集选择一个候选模型配置包括:从利用第二保真度评价方法进行评价并得到相应第二评价值的各候选模型配置中选择第二评价值最高/最低的候选模型配置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910618238.3/1.html,转载请声明来源钻瓜专利网。