[发明专利]一种参数寻优方法及计算设备有效
申请号: | 201810043729.5 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108229572B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 王志远;陈日涵;冯博;张夏天 | 申请(专利权)人: | 北京腾云天下科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 张涛;魏小薇 |
地址: | 100027 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 参数 方法 计算 设备 | ||
本发明公开了一种参数寻优方法,在计算设备中执行,包括:从所有参数组中选取第一数量个参数组作为候选参数组,其他未被选中的参数组记为剩余参数组;分别确定各候选参数组的评估值;在未达到预设的终止条件时,循环执行以下步骤:对于每一个剩余参数组:分别计算该剩余参数组与每一个候选参数组之间的相似度;根据该剩余参数组与每一个候选参数组的相似度以及各候选参数组的评估值来确定该剩余参数组的预测评估值;将预测评估值最大的第二数量个剩余参数组作为候选参数组,加入候选参数组空间;分别确定新加入的第二数量个候选参数组的评估值。最后,将候选参数组空间中评估值最大的候选参数组作为目标参数组。本发明一并公开了相应的计算设备。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种参数寻优方法及计算设备。
背景技术
随着移动互联网技术的发展,移动终端已成为人们获取信息的重要媒介,用户对移动终端的操作可以展示出用户的行为偏好。根据用户的行为偏好对用户群体进行划分,对同一个群体中的用户推送相似的信息,或利用相似用户来向目标用户推送信息(协同过滤),可以准确地向用户推送个性化内容、提供个性化服务。
现有的方案多是提取出用户特征,并标示用户所属的类别标签,将已知的用户特征-类别标签的对应关系作为训练样本,采用机器学习算法来训练分类器,将待测用户的用户特征输入训练好的分类器,即可输出该待测用户的类别标签。但是,现有的机器学习算法种类繁多,各个算法又存在多个需要手动设置的超参数(超参数即需要在训练分类器之前预先设置其值的参数,例如,对于随机森林算法,需要手动设置树的棵数、最大深度、每棵树的最大特征数等超参数;对于GBDT算法,需要手动设置弱学习器的数量、最大深度、内部节点再划分所需要的最小样本数、弱学习器的权重缩减系数等超参数;……)。超参数的取值会影响分类器的分类效果,进而影响用户分类的准确性。但是,目前超参数的设置往往依赖于工程师的经验,主观性较强,使得用户分类的准确性难以保证。此外,若抛弃工程师的主观经验因素,从客观的角度来设置合适的超参数,则需要采用各种超参数组合来训练分类器,将用户分类效果最好的分类器所对应的超参数组作为最优超参数组(或称网格搜索法,Grid Search)。这种方法需要消耗大量的时间,尤其是在机器学习算法的分类器的训练本身就很慢的情况下,尝试多种参数组合来不断训练分类器的时间消耗会令人难以忍受,在用户数据不断累积、变化的大数据背景下,这种方法也难以保证用户分类的准确性和时效性。
发明内容
为此,本发明提供一种参数寻优方法及计算设备,以解决或至少缓解上面存在的问题。
根据本发明的一个方面,提供一种参数寻优方法,在计算设备中执行,包括:从所有参数组中选取第一数量个参数组作为候选参数组,其他未被选中的参数组记为剩余参数组,每一个所述参数组中均包括相同数量个超参数,所述第一数量个候选参数组组成候选参数组空间;分别确定每一个候选参数组的评估值;在未达到预设的终止条件时,循环执行以下步骤:对于每一个剩余参数组:分别计算该剩余参数组与每一个候选参数组之间的相似度;根据该剩余参数组与每一个候选参数组的相似度以及各候选参数组的评估值来确定该剩余参数组的预测评估值;将预测评估值最大的第二数量个剩余参数组作为候选参数组,加入候选参数组空间;分别确定新加入的第二数量个候选参数组的评估值;以及,将候选参数组空间中评估值最大的候选参数组作为目标参数组。
可选地,在根据本发明的参数寻优方法中,从所有参数组中选取第一数量个参数组作为候选参数组的步骤包括:从所有参数组中随机选取第一数量个参数组作为候选参数组。
可选地,在根据本发明的参数寻优方法中,候选参数组的评估值按照以下步骤确定:在该候选参数组下,采用多个训练样本基于预设的机器学习算法来训练分类器;将多个测试样本输入训练好的分类器,根据分类器的输出来确定该候选参数组的评估值。
可选地,在根据本发明的参数寻优方法中,相似度按照以下公式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京腾云天下科技有限公司,未经北京腾云天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810043729.5/2.html,转载请声明来源钻瓜专利网。