[发明专利]资源发放模型的训练方法、装置、设备、存储介质及产品在审
申请号: | 202210583338.9 | 申请日: | 2022-05-25 |
公开(公告)号: | CN115018532A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 毛雪;史鑫磊;罗恒亮 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/20 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 谢冬寒 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 发放 模型 训练 方法 装置 设备 存储 介质 产品 | ||
本申请提供了一种资源发放模型的训练方法、装置、设备、存储介质及产品,属于互联网技术领域。方法包括:获取发放环节序列包括的多个发放环节的样本数据,发放环节的样本数据包括样本账号的参考特征信息、需求信息和第一回报信息;基于发放环节序列包括的多个发放环节的顺序,依次执行如下步骤,直到资源发放模型满足收敛条件为止,得到目标资源发放模型:基于当前发放环节的样本数据,确定当前发放环节的第二回报信息,第二回报信息用于表示样本账号在第一个环节至当前发放环节基于互联网平台发放的虚拟资源,对互联网平台产生的总回报,基于当前发放环节的样本数据和第二回报信息,对资源发放模型进行训练,提高了发放虚拟资源的有效性。
技术领域
本申请涉及互联网技术领域,特别涉及一种资源发放模型的训练方法、装置、设备、存储介质及产品。
背景技术
随着互联网技术的发展,虚拟资源(如卡券、红包等)发放在电商领域的应用越来越多,互联网平台通过向用户账号发放虚拟资源来促进用户消费,进而提高互联网平台的收益。而由于神经网络在电商领域的应用也越来越多,因此会通过基于神经网络训练的资源发放模型来为用户账号发放虚拟资源。
而相关技术中的资源发放模型只关注为哪些人群发放虚拟资源,也即资源发放模型只是确定出为哪些用户账号发放虚拟资源,且确定出这些用户账号后,后续每当有虚拟资源发放需求时,均直接向这些用户账号发放虚拟资源。由于用户账号在不同阶段有不同需求,因此为用户账号发放虚拟资源后,用户此时可能没有使用虚拟资源的需求,导致互联网平台无法得到相应的回报,进而导致虚拟资源发放的准确性较低。
发明内容
本申请实施例提供了一种资源发放模型的训练方法、装置、设备、存储介质及产品,能够提高发放虚拟资源的有效性。所述技术方案如下:
一方面,提供了一种资源发放模型的训练方法,所述方法包括:
获取发放环节序列包括的多个发放环节的样本数据,所述发放环节的样本数据包括样本账号的参考特征信息、需求信息和第一回报信息,所述需求信息用于表示所述样本账号在所述参考特征信息表示的参考环境下对互联网平台发放虚拟资源的需求,所述第一回报信息用于表示所述样本账号基于所述虚拟资源,对所述互联网平台产生的回报;
基于所述发放环节序列包括的多个发放环节的顺序,依次执行如下步骤,直到资源发放模型满足收敛条件为止,得到目标资源发放模型:
基于当前发放环节的样本数据,确定所述当前发放环节的第二回报信息,所述第二回报信息用于表示所述样本账号在第一个环节至所述当前发放环节基于所述互联网平台发放的虚拟资源,对所述互联网平台产生的总回报,基于所述当前发放环节的样本数据和第二回报信息,对所述资源发放模型进行训练。
在一些实施例中,所述基于所述当前发放环节的样本数据和第二回报信息,对所述资源发放模型进行训练,包括:
基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息;
基于所述参数调整信息,调整所述资源发放模型的模型参数。
在一些实施例中,所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息,包括:
基于第一发放环节的第二回报信息和所述当前发放环节的第二回报信息和第一回报信息,确定损失值,所述第一发放环节为所述当前发放环节的上一发放环节;
基于所述损失值、所述当前发放环节的参考特征信息和需求信息,确定所述资源发放模型的参数调整信息。
在一些实施例中,所述基于所述当前发放环节的样本数据和第二回报信息,确定所述当前发放环节对应的参数调整信息之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210583338.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:烹饪设备故障预测方法和装置
- 下一篇:一种投影设备及避障投影方法