[发明专利]训练预测模型的方法、预测方法及装置在审
申请号: | 202110519727.0 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113205189A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 徐瑜;胡洋;王成 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q10/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 预测 模型 方法 装置 | ||
1.一种训练预测模型的方法,包括:
利用多个第一样本和所述多个第一样本各自的第一标注信息来训练预测模型,得到经训练的预测模型;
利用经训练的预测模型分别对多个第二样本中的每个第二样本进行预测,得到多个第一预测结果;
根据所述多个第一预测结果,确定所述多个第二样本各自的第二标注信息和每个第二标注信息的权重;
利用所述多个第二样本、所述第二标注信息和所述权重,训练所述经训练的预测模型,直到所述预测模型的训练误差小于第一阈值;以及
在所述经训练的预测模型的训练误差大于第二阈值且小于所述第一阈值的情况下,获取新的多个第二样本,并返回所述对所述多个第二样本中的每个第二样本进行预测的步骤,其中,所述第一阈值大于所述第二阈值。
2.根据权利要求1所述的方法,其中,所述根据所述多个第一预测结果,确定所述多个第二样本各自的第二标注信息,包括:
将所述多个第一预测结果发送至用户,以使用户选择所述多个第一预测结果是否正确;
针对所述多个第一预测结果中被选择为不正确的第一预测结果,获取用户输入的针对所述第一预测结果的更正信息,作为与所述第一预测结果对应的第二标注信息;以及
针对所述多个第一预测结果中被选择为正确的第一预测结果,将第一预测结果作为与所述第一预测结果对应的第二标注信息。
3.根据权利要求1或2所述的方法,其中,所述确定所述多个第二样本各自的第二标注信息的权重,包括:
针对所述每个第二样本,
利用经训练的多个评估模型对所述第二样本进行预测,得到多个第二预测结果;以及
根据所述多个第二预测结果的一致性,确定对应的第二标注信息的权重。
4.根据权利要求3所述的方法,其中,所述经训练的多个评估模型是通过彼此不同的训练方法训练得到的。
5.根据权利要求3所述的方法,其中,所述利用所述多个第二样本、所述第二标注信息和所述权重,训练所述经训练的预测模型,包括:
针对所述每个第二样本,
利用所述预测模型对所述第二样本进行预测,得到第三预测结果;
利用损失函数确定所述第三预测结果和对应的第二标注信息之间的差异;以及
根据所述差异和与所述对应的第二标注信息的权重,调整所述预测模型的参数。
6.根据权利要求1所述的方法,还包括获取多个第二样本,所述获取多个第二样本包括:
获取原始行为数据;以及
从所述原始行为数据中随机抽取多个数据,作为所述多个第二样本。
7.根据权利要求1所述的方法,还包括获取多个第二样本,所述获取多个第二样本包括:
获取原始行为数据和关键词;以及
根据所述关键词,确定所述原始行为数据中与所述关键词匹配的多个数据,作为所述多个第二样本。
8.一种预测方法,包括:
获取行为数据;以及
利用预测模型对所述行为数据执行预测,得到预测结果;
其中,所述预测模型是利用根据权利要求1-7中任一项所述的方法训练的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110519727.0/1.html,转载请声明来源钻瓜专利网。