[发明专利]策略组合的优化方法及装置在审
申请号: | 202210321635.6 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114493885A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 顾咏丰;丁皓;吴华 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q40/02 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 策略 组合 优化 方法 装置 | ||
1.一种策略组合的优化方法,涉及对用于识别风险用户的策略组合的多轮次迭代更新,其中任一轮次包括:
在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合;
对伯努利分布进行随机采样;
在采样结果指示本轮接受次优策略的情况下,基于所述多个第一策略组合随机选取某个第一策略组合,作为本轮更新后的当前策略组合。
2.根据权利要求1所述的方法,其中,在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合,包括:
针对策略总集中未被包含在所述当前策略组合中的各个可选策略,将其分别添加至该当前策略组合,得到多个第一策略组合。
3.根据权利要求1所述的方法,其中,对伯努利分布进行随机采样,包括:
根据本轮对应的轮次数,确定本轮接受次优策略的概率,此概率与所述轮次数负相关;
对以所述概率为参数的伯努利分布进行所述随机采样。
4.根据权利要求1所述的方法,其中,对伯努利分布进行随机采样,包括:
确定各个第一策略组合针对多个风险用户样本的识别效果评分;
根据所述多个第一策略组合对应的多个识别效果评分中最小值减去最大值而得到的差值,确定所述概率,此概率与所述差值正相关;
对以所述概率为参数的伯努利分布进行所述随机采样。
5.根据权利要求1所述的方法,其中,基于所述多个第一策略组合随机选取某个第一策略组合,包括:
根据各个第一策略组合针对多个风险用户样本的识别效果评分,从所述多个第一策略组合中确定出识别效果评分排在预设名次范围内的多个第二策略组合;
从所述多个第二策略组合中随机选取出某个第二策略组合,对应某个第一策略组合。
6.根据权利要求5所述的方法,其中,从所述多个第二策略组合中随机选取出某个第二策略组合,包括:
确定各个第二策略组合本轮被选中的概率,形成对应的概率分布;
通过对所述概率分布进行随机抽样,得到所述某个第二策略组合。
7.根据权利要求6所述的方法,其中,确定各个第二策略组合本轮被选中的概率,包括:
针对所述各个第二策略组合,根据其识别效果评分确定其本轮被选中的概率,此概率与其识别效果评分正相关。
8.根据权利要求6所述的方法,其中,确定各个第二策略组合本轮被选中的概率,形成对应的概率分布,包括:
根据所述多个第二策略组合的数量,确定所述各个第二策略组合本轮被选中的概率,形成均匀分布。
9.根据权利要求1所述的方法,其中,在对伯努利分布进行随机采样后,还包括:
在采样结果指示本轮不接受次优策略的情况下,根据各个第一策略组合针对多个风险用户样本的识别效果评分,选取识别效果评分最高的第一策略组合,作为本轮更新后的当前策略组合。
10.一种策略组合的优化方法,涉及对用于执行目标判别任务的策略组合的多轮次迭代更新,其中任一轮次包括:
在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合;
对伯努利分布进行随机采样;
在采样结果指示本轮接受次优策略的情况下,基于所述多个第一策略组合随机选取某个第一策略组合,作为本轮更新后的当前策略组合。
11.根据权利要求10所述的方法,其中,对伯努利分布进行随机采样,包括:
确定各个第一策略组合针对多个任务标注样本的识别效果评分;
根据所述多个第一策略组合对应的多个识别效果评分中最小值减去最大值而得到的差值,确定所述概率,此概率与所述差值正相关;
对以所述概率为参数的伯努利分布进行所述随机采样。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210321635.6/1.html,转载请声明来源钻瓜专利网。