[发明专利]模型离线训练评估方法、装置、介质和电子设备有效
申请号: | 202011217664.5 | 申请日: | 2020-11-04 |
公开(公告)号: | CN112256768B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 李嘉晨;郭凯;刘雷 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06F16/2457;G06F16/9535;G06Q30/02;G06Q50/16 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 离线 训练 评估 方法 装置 介质 电子设备 | ||
公开了一种模型离线训练评估方法、装置、介质以及电子设备。其中的方法包括:经由待检验点击通过率模型对预设集合中的多个历史提供信息记录分别执行为用户提供信息操作,获得多个第一操作结果;获取多个第一操作结果与相应第二操作结果的相似度;根据相似度对预设集合中的历史提供信息记录进行筛选;利用筛选出的历史提供信息记录,对状态预测模型和待检验点击通过率模型进行模拟在线训练,获得新的点击通过率模型,新的点击通过率模型用于再次对预设集合中的历史提供信息记录进行筛选;对至少两次筛选出的历史提供信息记录,进行预设性能指标的统计,获得待检验点击通过率模型的性能指标。本公开提供的技术方案有利于提高模型离线训练效果。
技术领域
本公开涉及计算机技术,尤其是涉及一种模型离线训练评估方法、模型离线训练评估装置、存储介质以及电子设备。
背景技术
信息推荐以及信息搜索等技术,均涉及向用户提供相应的信息。在向用户提供信息的过程中,通常会利用CTR(Click Through Rate,点击通过率)模型,对多个待提供信息分别进行用户点击信息的概率预测,并根据预测出的多个概率对多个待提供信息进行排序,以便于确定向用户提供的信息。
在CTR模型的应用过程中,通常会利用离线训练后的CTR模型,作为在线CTR模型的初始化模型,因此,CTR模型的离线训练效果,会影响在线CTR模型的性能。准确的评估CTR模型的离线训练效果,从而提高CTR模型的离线训练效果,是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种模型离线训练评估方法、模型离线训练评估装置、存储介质以及电子设备。
根据本公开实施例的一方面,提供了一种模型离线训练评估方法,该方法包括:经由待检验点击通过率模型针对预设集合中的多个用户的历史提供信息记录,分别执行为用户提供信息操作,获得多个第一操作结果;获取所述多个第一操作结果与相应历史提供信息记录中的线上点击通过率模型执行为用户提供信息操作的第二操作结果的相似度,获得多个相似度;根据所述多个相似度,对所述预设集合中的历史提供信息记录进行筛选;利用筛选出的历史提供信息记录,对状态预测模型进行模拟在线训练;根据所述状态预测模型在模拟在线训练过程中的输出,对所述待检验点击通过率模型进行模拟在线训练,获得新的点击通过率模型,所述待检验点击通过率模型被所述新的点击通过率模型更新,且所述更新后的待检验点击通过率模型用于再次对预设集合中的历史提供信息记录进行筛选;对至少两次筛选出的历史提供信息记录,进行预设性能指标的统计,获得待检验点击通过率模型的性能指标。
在本公开一实施方式中,所述待检验点击通过率模型包括:信息推荐模型、或者信息搜索模型;所述为用户提供信息操作包括:信息推荐操作、或者信息搜索操作。
在本公开又一实施方式中,所述经由待检验点击通过率模型针对预设集合中的多个用户的历史提供信息记录,分别执行为用户提供信息操作,获得多个第一操作结果,包括:针对预设集合中的任一用户的任一历史提供信息记录,经由待检验点击通过率模型,分别预测该历史提供信息记录中的被提供信息列表中的各被提供信息的点击概率,预测获得的所述各被提供信息的点击概率被作为一第一操作结果。
在本公开再一实施方式中,所述针对预设集合中的任一用户的任一历史提供信息记录,经由待检验点击通过率模型,分别预测该历史提供信息记录中的被提供信息列表中的各被提供信息的点击概率,包括:针对预设集合中的任一用户的任一历史提供信息记录,将该历史提供信息记录中的用户在提供信息操作前执行的多种类型的行为的行为量特征、用户在提供信息操作前的用户偏好以及各被提供信息的信息特征,提供给所述待检验点击通过率模型,以经由所述待检验点击通过率模型预测所述各被提供信息的点击概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011217664.5/2.html,转载请声明来源钻瓜专利网。