[发明专利]一种基于模拟环境的出行平台优惠券发放优化方法在审
申请号: | 202110886220.9 | 申请日: | 2021-08-03 |
公开(公告)号: | CN113327141A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 张超;胡南;刘泽琳;邢育超;刘昌鑫;徐亮 | 申请(专利权)人: | 南栖仙策(南京)科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/30;G06N20/00 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 210038 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模拟 环境 出行 平台 优惠券 发放 优化 方法 | ||
1.一种基于模拟环境的出行平台优惠券发放优化方法,其特征在于,包括出行平台优惠券发放的模拟环境构建、出行优惠券发放策略优化和用户行为结果复盘三个部分的实现,其中,出行平台优惠券发放的模拟环境构建包括构建平台优惠券发放模型和用户行为模型;所述出行优惠券发放策略优化是根据所设定的优化目标,使得模拟环境内的平台优惠券发放模型和用户行为模型进行行为交互,优化后的平台优惠券发放策略;所述用户行为结果复盘将优化后的平台优惠券发放策略在现有的出行平台中进行投放,比对真实用户行为和模拟环境内的用户行为模型输出的差异性概率,对模拟环境中的用户行为模型进行修正。
2.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述出行平台优惠券发放的模拟环境构建过程中,对实际发生的历史平台发券内容和用户打车行为数据进行学习,构造平台优惠券发放模型和用户行为模型;学习过程中,首先基于出行平台视角,定义并抽象出状态数据
序列;利用机器学习算法,通过所述状态-动作序列学习得到两个策略模型,分别是平台优惠券发放模型和用户行为模型。
3.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述出行优惠券发放策略优化过程中,设定优化目标,给定随机初始状态数据
4.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述用户行为结果复盘中,将优化后的平台优惠券发放模型的输出内容,即优化后的出行优惠券发放内容,在现有出行平台中进行实际发放,获取出行平台中真实用户动作数据,并输出出行平台中真实用户动作数据和模拟环境内用户行为模型的差异性,对模拟环境中的用户行为模型的输出进行修正。
5.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述的出行平台优惠券发放的模拟环境中的平台优惠券发放模型,其输入为状态数据
6.根据权利要求1所述的基于模拟环境的出行平台优惠券发放优化方法,其特征在于,所述的用户行为结果复盘中的用户行为模型修正过程中,对于当前状态数据
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南栖仙策(南京)科技有限公司,未经南栖仙策(南京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110886220.9/1.html,转载请声明来源钻瓜专利网。