[发明专利]资源发放模型的训练方法、装置、设备、存储介质及产品在审
申请号: | 202210583338.9 | 申请日: | 2022-05-25 |
公开(公告)号: | CN115018532A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 毛雪;史鑫磊;罗恒亮 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/20 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 谢冬寒 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 发放 模型 训练 方法 装置 设备 存储 介质 产品 | ||
1.一种资源发放模型的训练方法,其特征在于,所述方法包括:
获取发放环节序列包括的多个发放环节的样本数据,所述发放环节的样本数据包括样本账号的参考特征信息、需求信息和第一回报信息,所述需求信息用于表示所述样本账号在所述参考特征信息表示的参考环境下对互联网平台发放虚拟资源的需求,所述第一回报信息用于表示所述样本账号基于所述虚拟资源,对所述互联网平台产生的回报;
基于所述发放环节序列包括的多个发放环节的顺序,依次执行如下步骤,直到资源发放模型满足收敛条件为止,得到目标资源发放模型:
基于当前发放环节的样本数据,确定所述当前发放环节的第二回报信息,所述第二回报信息用于表示所述样本账号在第一个环节至所述当前发放环节基于所述互联网平台发放的虚拟资源,对所述互联网平台产生的总回报,基于所述当前发放环节的样本数据和第二回报信息,对所述资源发放模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述基于所述当前发放环节的样本数据和第二回报信息,对所述资源发放模型进行训练,包括:
基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息;
基于所述参数调整信息,调整所述资源发放模型的模型参数。
3.根据权利要求2所述的方法,其特征在于,所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息,包括:
基于第一发放环节的第二回报信息和所述当前发放环节的第二回报信息和第一回报信息,确定损失值,所述第一发放环节为所述当前发放环节的上一发放环节;
基于所述损失值、所述当前发放环节的参考特征信息和需求信息,确定所述资源发放模型的参数调整信息。
4.根据权利要求2或3所述的方法,其特征在于,所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息之前,所述方法还包括:
在第一发放环节的第二回报信息表示的第一回报值小于所述当前发放环节的第二回报信息表示的第二回报值的情况下,确定调整所述资源发放模型的模型参数,执行所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息的步骤;
其中,所述第一发放环节为所述当前发放环节的上一发放环节。
5.根据权利要求1或2所述的方法,其特征在于,所述基于当前发放环节的样本数据,确定所述当前发放环节的第二回报信息,包括:
调用第一发放环节训练得到的资源发放模型,所述第一发放环节为所述当前发放环节的上一发放环节;
基于所述当前发放环节的样本数据,通过所述资源发放模型,确定所述当前发放环节的第二回报信息。
6.根据权利要求1所述的方法,其特征在于,所述第一回报信息的确定过程包括:
获取目标商品的点击参数、购买参数、价格参数和所发放虚拟资源的成本参数中的至少一项,所述目标商品为所述虚拟资源能够兑换的商品;
基于所述点击参数、所述购买参数、所述价格参数和所述成本参数中的至少一项,确定所述第一回报信息,所述点击参数、所述购买参数和所述价格参数均与所述第一回报信息正相关,所述成本参数与所述第一回报信息负相关。
7.根据权利要求6所述的方法,其特征在于,所述虚拟资源的发放渠道为多个,多个发放渠道分别配置有发放权重;
所述基于所述点击参数、所述购买参数、所述价格参数和所述成本参数中的至少一项,确定所述第一回报信息,包括:
确定所发放虚拟资源的目标发放渠道;
基于所述点击参数、所述购买参数、所述价格参数和所述成本参数中的至少一项,确定所述目标发放渠道的回报信息;
将所述目标发放渠道的回报信息与所述目标发放渠道的发放权重之积,作为所述第一回报信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210583338.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:烹饪设备故障预测方法和装置
- 下一篇:一种投影设备及避障投影方法