[发明专利]多分类模型自学习在线更新方法、系统及装置在审
申请号: | 202010922752.9 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112036579A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 李弦;阮晓雯;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 袁文婷;张娓娓 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 自学习 在线 更新 方法 系统 装置 | ||
1.一种多分类模型自学习在线更新方法,应用于电子装置,其特征在于,所述方法包括:
根据预设统计周期对待更新模型的预测性能进行监测统计,并将各统计周期内的预测性能统计结果存入统计数据库;
使用预设的触发机制对所述统计数据库内的数据进行检查,以判断所述待更新模型是否需要进行在线更新;
若所述待更新模型需要进行在线更新,则获取线上新产生数据,并根据所述新产生数据对待更新模型的训练数据进行更新;
使用更新后训练数据对所述待更新模型进行更新训练,以获得更新后的多分类模型。
2.根据权利要求1所述的多分类模型自学习在线更新方法,其特征在于,所述统计数据库存储在区块链的节点中,并且所述预测性能包括预测精度precision值,所述预测精度precision值的计算公式为:
预测精度Precision值=正确分类的样本数/整体的样本数;并且,
所述触发机制包括:
机制A:若包含当前统计周期在内的历史N个统计周期的预测精度precision值持续下降,则判定所述待更新模型需要进行在线更新,其中,N为第一预设参数。
3.根据权利要求2所述的多分类模型自学习在线更新方法,其特征在于,所述触发机制还包括:
机制B:若当前统计周期的预测精度Precision值小于预测精度平均值-2*预测精度标准差,或当前统计周期的预测精度Precision值小于预测精度平均值-下降百分比P;则判定所述待更新模型需要进行在线更新;其中,
所述预测精度平均值为历史N个统计周期的预测精度Precision值的平均值,所述预测精度标准差为历史N个统计周期的预测精度Precision值的标准差,所述下降百分比P为第二预测参数。
4.根据权利要求3所述的多分类模型自学习在线更新方法,其特征在于,所述触发机制还包括:
机制C:判定所述待更新模型的上线时长是否达到预设的更新周期阈值,若达到,则判定所述待更新模型需要进行在线更新;其中,
所述更新周期阈值为所述统计周期的M倍;其中,M为自然数,且≥2。
5.根据权利要求4所述的多分类模型自学习在线更新方法,其特征在于,若所述触发机制为所述机制A或所述机制B,则所述根据新产生数据对待更新模型的训练数据进行更新包括:
增量式更新:
检验所述新产生数据与所述待更新模型的历史训练数据的分布是否一致;
若一致,则将所述新产生数据与所述历史训练数据进行合并,生成训练更新数据;其中,
若所述新产生数据与所述历史训练数据的各类样本的占比差均小于预设占比阈值,则判定所述新产生数据与所述历史训练数据的分布一致。
6.根据权利要求5所述的多分类模型自学习在线更新方法,其特征在于,
若所述新产生数据与所述历史训练数据的分布不一致,则通过下采样和过采样的方式对所述历史训练数据的各类样本进行循环式处理,直至所述新产生数据与所述历史训练数据的各类样本的占比差均小于预设占比阈值;
将所述新产生数据与循环处理后的历史训练数据进行合并,生成所述训练更新数据。
7.根据权利要求6所述的多分类模型自学习在线更新方法,其特征在于,若所述触发机制为所述机制C,则所述根据新产生数据对待更新模型的训练数据进行更新包括:
滚动式更新:
设定滚动固定时长,并根据所述滚动固定时长自所述新产生数据与所述历史训练数据中选取相应的数据的作为所述训练更新数据;其中,
所述滚动固定时长为所述统计周期的L倍;其中,L为自然数,且L>M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010922752.9/1.html,转载请声明来源钻瓜专利网。