[发明专利]利用机器学习模型执行预测的方法及装置在审
申请号: | 201810397572.6 | 申请日: | 2018-04-28 |
公开(公告)号: | CN110414690A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 舒程珣;涂威威;陈雨强;戴文渊;杨强 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N99/00 | 分类号: | G06N99/00;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 朱志玲;李燕华 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据记录 机器学习模型 预测 连续数据 序列特征 记录 样本 内部状态 循环结构 样本提供 预测结果 预测目标 装置提供 | ||
提供了一种利用机器学习模型执行训练的方法及装置。所述方法包括:获取将针对其执行预测的当前数据记录;获取第一机器学习模型针对所述当前数据记录所涉及的一系列连续数据记录执行预测的过程中所产生的内部状态,以用作与所述当前数据记录相应的序列特征,其中,第一机器学习模型具有循环结构,所述一系列连续数据记录包括在所述当前数据记录之前连续出现的在先数据记录,或者,所述一系列连续数据记录包括在所述当前数据记录之前连续出现的在先数据记录连同所述当前数据记录;产生与所述当前数据记录相应的预测样本,其中,所述序列特征被用作所述预测样本所包括的特征之一;利用第二机器学习模型针对预测样本提供关于预测目标的预测结果。
技术领域
本申请总体说来涉及人工智能领域,更具体地讲,涉及一种利用机器学习模型执行预测的方法及装置、以及用于训练机器学习模型的方法及装置。
背景技术
随着海量数据的出现,人工智能技术迅速发展,而机器学习是人工智能发展到一定阶段的必然产物,其致力于通过计算的手段,从大量数据中挖掘有价值的潜在信息。
在计算机系统中,“经验”通常以“数据”形式存在。每条数据记录可被看作关于一个事件或对象的描述,并且每条数据记录包括反映事件或对象在某方面的表现或性质的各个事项,这些事项可被称之为数据的“属性”。如何利用原始数据记录的属性获得适宜的机器学习样本,会对机器学习模型的效果产生很大的影响。
对于连续出现的序列数据记录而言,在特征提取过程中,通常采用人为设计时间窗进行统计等方法来获得机器学习样本的序列特征。然而,此类方法需要专家知识和大量的工作时间,对此,机器学习建模技术人员难以掌握。而且,即便耗费了大量的人力,按照此类方法获得的样本特征仍难以准确地反映真实连续数据之间的复杂的序列特性或时序规律,从而导致预测效果不理想。事实上,对于很多应用场景(例如,在线推荐、反欺诈等),连续数据记录之间的序列特性或时序规律往往具有很大的预测价值,但在现实中却难以被有效地利用。
发明内容
根据本申请示例性实施例,提供一种利用机器学习模型执行预测的方法,包括:获取将针对其执行预测的当前数据记录;获取第一机器学习模型针对所述当前数据记录所涉及的一系列连续数据记录执行预测的过程中所产生的内部状态,以用作与所述当前数据记录相应的序列特征,其中,第一机器学习模型具有循环结构,所述一系列连续数据记录包括在所述当前数据记录之前连续出现的在先数据记录,或者,所述一系列连续数据记录包括在所述当前数据记录之前连续出现的在先数据记录连同所述当前数据记录;产生与所述当前数据记录相应的预测样本,其中,所述序列特征被用作所述预测样本所包括的特征之一;以及利用第二机器学习模型针对预测样本来提供关于预测目标的预测结果。
可选地,第一机器学习模型可被事先训练为针对一系列连续数据记录来提供关于序列预测目标的序列预测结果,其中,序列预测目标与所述预测目标相同或不同。
可选地,获取内部状态的步骤可包括:将所述当前数据记录所涉及的一系列连续数据记录依次输入第一机器学习模型,并提取第一机器学习模型在所述一系列连续数据记录之中的最后一个数据记录被输入第一机器学习模型之后产生的内部状态。
可选地,在所述方法中,所述当前数据记录涉及待预测行为对象,所述在先数据记录涉及连续正向行为对象,其中,
可选地,第一机器学习模型可被事先训练为针对一系列连续正向行为对象来预测下一连续正向行为对象,或者,第一机器学习模型可被事先训练为针对一系列连续正向行为对象和接下来连续出现的下一行为对象来预测所述下一行为对象对应正向行为对象还是负向行为对象,
可选地,在利用第二机器学习模型针对预测样本来提供关于预测目标的预测结果的步骤中,可利用第二机器学习模型来预测所述预测样本对应正向行为对象还是负向行为对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810397572.6/2.html,转载请声明来源钻瓜专利网。