[发明专利]在线学习方法及装置、计算机可读存储介质有效
申请号: | 201910591330.5 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110390041B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 李君浩;李铁铮 | 申请(专利权)人: | 上海上湖信息技术有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/9536;G06N3/04;G06N3/08;G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 周书敏;李笑笑 |
地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 学习方法 装置 计算机 可读 存储 介质 | ||
一种在线学习方法及装置、计算机可读存储介质,包括:获取线上业务数据,所述线上业务数据包括用户特征,其中,所述用户特征包括以下至少一种:用户的属性信息、用户的操作行为信息;采用分析模型对所述线上业务数据进行分析,得到预设参数的分析结果,其中,所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到;基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。采用上述方案,能够实现在线学习,并提高在线学习结果的准确度。
技术领域
本发明实施例涉及在线学习技术领域,尤其涉及一种在线学习方法及装置、计算机可读存储介质。
背景技术
互联网广告以及搜索推荐等业务场景中,通常采用机器学习模型进行分类。目前,通常采用的机器学习模型为梯度提升决策树模型(Gradient Boosting Decision Tree,GBDT)。在互联网业务中,每时每刻都会产生大量的新的数据样本、客群属性可能发生变化,客户习惯偏好也可能发生变化等,为了能够快速捕捉到上述变化,需要机器学习模型能够快速迭代,具备在线学习能力。
然而,对于采用GBDT模型的互联网广告以及搜索推荐等业务场景而言,由于GBDT模型无法进行在线学习,在互联网广告以及搜索推荐等业务场景中,使用GBDT模型进行业务处理所得到的结果的准确度较低。
发明内容
本发明实施例解决的技术问题是在互联网广告以及搜索推荐等业务场景中,使用GBDT模型进行业务处理所得到的结果的准确度较低。
为解决上述技术问题,本发明实施例提供一种在线学习方法,包括:获取线上业务数据,所述线上业务数据包括用户特征,其中,所述用户特征包括以下至少一种:用户的属性信息、用户的操作行为信息;采用分析模型对所述线上业务数据进行分析,得到预设参数的分析结果,其中,所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到;基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。
可选的,采用如下方式构建所述分析模型:获取训练样本集中的每个训练样本分别对应的用户特征,以及所述每个训练样本对应的标签;将所述每个训练样本分别对应的用户特征输入至梯度提升决策树模型中,采用所述梯度提升决策树中的每个决策树分别对每个训练样本进行分类,记录所述每个训练样本在所述每个决策树中落入的叶子节点的位置;对所述每个训练样本在所述每个决策树中落入的叶子节点的位置进行编码,生成所述每个训练样本在所述每个决策树中的分类信息;基于所述每个训练样本分别对应的用户特征、所述每个决策树的叶子节点的数目、所述每个训练样本在所述每个决策树中的分类信息,采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型;将所述每个训练样本分别对应的用户特征,分别输入至所述每个决策树一一对应的深度神经网络模型中,得到所述每个深度神经网络模型对所述每个训练样本的分类结果;基于所述每个深度神经网络模型对所述每个训练样本的分类结果,采用所述深度神经网络算法,结合所述每个训练样本对应的标签,训练得到所述分析模型。
可选的,所述采用深度神经网络算法为每个决策树构建一一对应的深度神经网络模型,包括:基于所述每个训练样本分别对应的用户特征,第i个决策树的叶子节点的数目,采用深度神经网络算法搭建初步的深度神经网络模型;将所述每个训练样本分别对应的用户特征以及所述每个训练样本在所述第i个决策树中的分类信息输入至所述初步的深度神经网络模型中,对所述初步的深度神经网络模型进行分类学习;当所述初步的深度神经网络模型的输出结果与所述第i个决策树的分类结果的差异满足设定范围时,训练得到所述第i个决策树对应的深度神经网络模型,其中,1≤i≤P,P为所述梯度提升决策树模型中的决策树的总数目。
可选的,所述基于所述线上业务数据对所述分析模型进行定期更新,包括:按照预设周期,获取预设时长内的线上业务数据;采用所述预设时长内的线上业务数据,定期对所述分析模型进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海上湖信息技术有限公司,未经上海上湖信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910591330.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:实验数据查询系统
- 下一篇:一种智慧农业合作社微官网服务系统