[发明专利]机器学习模型超参数推断方法及装置、介质、电子设备在审
申请号: | 201811024563.9 | 申请日: | 2018-09-04 |
公开(公告)号: | CN109934348A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 董厶溢 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06N5/04 | 分类号: | G06N5/04 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器学习模型 参数推断 电子设备 概率分布 计算机可读存储介质 期望最大化算法 人工智能技术 概率模型 手动干预 似然函数 构建 | ||
1.一种机器学习模型超参数推断方法,其特征在于,包括:
根据初始超参数和与所述初始超参数对应的机器学习模型性能构建一概率模型,得到所述初始超参数与所述机器学习模型性能之间的概率分布关系;
通过期望最大化算法计算使所述概率分布关系的对数似然函数具有最大值的目标超参数。
2.根据权利要求1所述的机器学习模型超参数推断方法,其特征在于,根据初始超参数和与所述初始超参数对应的机器学习模型性能构建一概率模型,包括:
根据初始超参数和与所述初始超参数对应的机器学习模型性能构建一高斯过程模型。
3.根据权利要求1所述的机器学习模型超参数推断方法,其特征在于,所述初始超参数包括多个子超参数;
根据初始超参数和与所述初始超参数对应的机器学习模型性能构建一概率模型,包括:
将原始图像和多个所述子超参数输入所述机器学习模型进行图像识别;
获取所述机器学习模型输出的预测图像;
根据所述原始图像和所述预测图像之间的匹配程度,确定所述机器学习模型性能;
根据所述初始超参数和所述机器学习模型性能构建所述概率模型。
4.根据权利要求3所述的机器学习模型超参数推断方法,其特征在于,所述初始超参数包括第一子超参数、第二子超参数和第三子超参数,其中,所述第一子超参数为学习率,所述第二子超参数为卷积核大小,所述第三子超参数为通道数。
5.根据权利要求1所述的机器学习模型超参数推断方法,其特征在于,通过期望最大化算法计算使所述概率分布关系具有极大似然估计值的目标超参数,包括:
通过期望最大化算法计算所述概率分布关系的对数似然函数;
获取使所述对数似然函数具有最大值的所述目标超参数。
6.根据权利要求1或2所述的机器学习模型超参数推断方法,其特征在于,所述方法还包括:
将所述目标超参数输入所述机器学习模型,判断所述目标超参数是否收敛;
若不收敛,将所述目标超参数和对应的所述机器学习模型性能输入至所述概率模型进行循环迭代,直至所述目标超参数收敛。
7.一种机器学习模型超参数推断装置,其特征在于,包括:
概率模型构建模块,用于根据初始超参数和与所述初始超参数对应的机器学习模型性能构建一概率模型,得到所述超参数与所述机器学习模型性能之间的概率分布关系;
期望最大化模块,用于通过期望最大化算法计算使所述概率分布关系的对数似然函数具有最大值的目标超参数。
8.根据权利要求7所述的机器学习模型超参数推断装置,其特征在于,所述概率模型为一高斯过程模型。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的机器学习模型超参数推断方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-6任一项所述的机器学习模型超参数推断方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811024563.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扩展问答知识库的装置
- 下一篇:一种基于剪枝搜索的简单吃墩博弈求解方法