[发明专利]模型协同优化的方法、装置、介质和电子设备有效
申请号: | 202011024383.8 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112115365B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 李嘉晨;郭凯;胡磊;付东东 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/02;G06Q50/16 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 协同 优化 方法 装置 介质 电子设备 | ||
公开了一种模型协同优化的方法、装置、介质以及电子设备。其中的方法包括:在多种类型的点击通过率模型中的任一点击通过率模型执行了为用户提供信息操作的情况下,检测用户针对提供信息操作所提供的信息的反馈行为;根据反馈行为确定提供信息操作的回馈状态信息;经由状态预测模型的预测处理,获得用户在提供信息操作前后的状态变化;根据回馈状态信息和状态变化,形成状态预测模型的第一损失和点击通过率模型的第二损失;在状态预测模型中反向传播第一损失,在提供信息操作的点击通过率模型中反向传播第二损失,以分别调整状态预测模型和执行了提供信息操作的点击通过率模型的模型参数。本公开提供的技术方案有利于使各模型协同优化。
技术领域
本公开涉及计算机技术,尤其是涉及一种模型协同优化的方法、模型协同优化的装置、存储介质以及电子设备。
背景技术
信息推荐以及信息搜索等技术,均涉及向用户提供相应的信息。在向用户提供信息的过程中,通常会利用CTR(Click Through Rate,点击通过率)模型,对多个待提供信息分别进行用户点击信息的概率预测,并根据预测出的多个概率对多个待提供信息进行排序,以便于确定向用户提供的信息。
如何优化CTR模型,以获得较好的信息提供效果,是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种模型协同优化的方法、模型协同优化的装置、存储介质以及电子设备。
根据本公开实施例的一个方面,提供了一种模型协同优化的方法,包括:在多种类型的点击通过率模型中的任一点击通过率模型执行了为用户提供信息操作的情况下,检测所述用户针对所述提供信息操作所提供的信息的反馈行为;根据所述反馈行为,确定所述提供信息操作的回馈状态信息;经由状态预测模型的预测处理,获得所述用户在所述提供信息操作前后的状态变化;将所述回馈状态信息和所述状态变化,分别代入所述状态预测模型的第一损失函数以及点击通过率模型的第二损失函数中,形成所述状态预测模型的第一损失和所述点击通过率模型的第二损失;在所述状态预测模型中反向传播所述第一损失,在所述提供信息操作的点击通过率模型中反向传播所述第二损失,以分别调整所述状态预测模型和执行了所述提供信息操作的点击通过率模型的模型参数。
在本公开一实施方式中,所述多种类型的点击通过率模型包括:至少一信息推荐类型的点击通过率模型以及至少一信息搜索类型的点击通过率模型;所述为用户提供信息操作包括:信息推荐操作、或者信息搜索操作。
在本公开又一实施方式中,所述根据所述反馈行为,确定所述提供信息操作的回馈状态信息,包括:根据所述反馈行为,判断所述提供信息是否被用户关注;为被用户关注的提供信息设置第一回馈状态信息,为未被用户关注的提供信息设置第二回馈状态信息。
在本公开再一实施方式中,所述根据所述反馈行为,确定所述提供信息操作的回馈状态信息,包括:预测所述反馈行为引起预定事件在所述提供信息操作后的发生概率的变化;将所述发生概率的变化作为所述提供信息操作的回馈状态信息。
在本公开再一实施方式中,所述根据所述反馈行为,确定所述提供信息操作的回馈状态信息,包括:对预定类型的反馈行为的数量以及所述预定类型的反馈行为各自对应的权值,进行加权平均计算;将所述加权平均计算的结果作为所述提供信息操作的回馈状态信息。
在本公开再一实施方式中,所述经由状态预测模型的预测处理,获得所述用户在所述提供信息操作前后的状态变化,包括:将所述用户的上下文信息提供给所述状态预测模型,经由所述状态预测模型基于所述用户的上下文信息进行预测处理,获得所述用户在所述提供信息操作前的第一状态信息;将所述用户的上下文信息、所述回馈状态信息以及所述用户在所述提供信息操作后的用户特征,提供给所述状态预测模型,经由所述状态预测模型基于所述用户的上下文信息、所述回馈状态信息以及所述用户特征进行预测处理,获得所述用户在所述提供信息操作后的第二状态信息;根据所述第一状态信息和所述第二状态信息的差异,确定所述用户在所述提供信息操作前后的状态变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011024383.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防过热保护的电路断路器智能保护装置
- 下一篇:一种抽拉式的料盘定位载台