[发明专利]一种参数寻优方法及计算设备有效
申请号: | 201810043729.5 | 申请日: | 2018-01-17 |
公开(公告)号: | CN108229572B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 王志远;陈日涵;冯博;张夏天 | 申请(专利权)人: | 北京腾云天下科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 张涛;魏小薇 |
地址: | 100027 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 参数 方法 计算 设备 | ||
1.一种用户分类方法,在计算设备中执行,所述计算设备与数据存储装置通信连接,所述数据存储装置中存储有用户特征,所述方法包括:
获取数据存储装置中存储的用户特征,采用所述用户特征中的全部或部分项来构成用户特征向量;
将所述用户特征向量输入分类器,以便所述分类器输出所述用户的类别标签,其中,所述分类器的目标参数组按照以下步骤确定:
从所有参数组中选取第一数量个参数组作为候选参数组,其他未被选中的参数组记为剩余参数组,每一个所述参数组中均包括相同数量个超参数,所述第一数量个候选参数组组成候选参数组空间;分别确定每一个候选参数组的评估值,所述候选参数组的评估值按照以下步骤确定:采用多个训练样本基于预设的机器学习算法来训练分类器,将多个测试样本输入训练好的分类器,根据分类器的输出来确定该候选参数组的评估值,其中,所述训练样本为标注了类别标签的用户特征向量,所述测试样本为未参与训练的标注了类别标签的用户特征向量;
在未达到预设的终止条件时,循环执行以下步骤:
对于每一个剩余参数组:分别计算该剩余参数组与每一个候选参数组之间的相似度;
按照以下公式,根据剩余参数组与每一个候选参数组的相似度以及
各候选参数组的评估值来确定该剩余参数组的预测平均值mean:
其中,表示参数组和参数组的相似度,为剩余参数组,为候选参数组,yi为候选参数组的评估值,m为当前候选参数组空间中所包括的候选参数组的数量,1≤i≤m,β为常数;
按照以下公式,根据剩余参数组与每一个候选参数组的相似度来确定该剩余参数组的预测标准差var:
按照以下公式,根据所述预测平均值和预测标准差来确定该剩余参数组的预测评估值result:
result=mean+λvar
其中,λ为常数;
将预测评估值最大的第二数量个剩余参数组作为候选参数组,加入候选参数组空间;
分别确定新加入的第二数量个候选参数组的评估值;
以及
将候选参数组空间中评估值最大的候选参数组作为目标参数组。
2.如权利要求1所述的方法,其中,所述从所有参数组中选取第一数量个参数组作为候选参数组的步骤包括:从所有参数组中随机选取第一数量个参数组作为候选参数组。
3.如权利要求1或2所述的方法,其中,所述相似度按照以下公式计算:
其中,表示剩余参数组与候选参数组的相似度,|| ||2表示求二范数,γ为常数。
4.如权利要求1所述的方法,其中,所述参数组的总数量、所述第一数量、所述第二数量满足:参数组的总数量第一数量第二数量。
5.如权利要求1所述的方法,其中,所述终止条件为循环次数达到预设的阈值。
6.如权利要求1所述的方法,其中,在所述从所有参数组中选取第一数量个参数组作为候选参数组的步骤之前,还包括:
分别设置每一个超参数的边界区间;
将每一个超参数在其边界区间内离散化,得到多个离散值;
分别选取每一个超参数的一个离散值,组成一个参数组。
7.一种计算设备,包括:
至少一个处理器;和
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-6中任一项所述的用户分类方法的指令。
8.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-6中任一项所述的用户分类方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京腾云天下科技有限公司,未经北京腾云天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810043729.5/1.html,转载请声明来源钻瓜专利网。