[发明专利]一种基于强化学习的优惠券智能派送方法在审

申请号：	201911003360.6	申请日：	2019-10-22
公开（公告）号：	CN110751524A	公开（公告）日：	2020-02-04
发明（设计）人：	郭宏亮;杨其锦;何闵	申请（专利权）人：	电子科技大学
主分类号：	G06Q30/02	分类号：	G06Q30/02;G06N3/08;G06N3/04;G06F16/215
代理公司：	51229 成都正华专利代理事务所(普通合伙)	代理人：	陈选中
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于强化学习的优惠券智能派送方法，该方法解决了传统优惠券派送的序列决策问题以及传统优惠券派送方法为静态推荐方法。本发明采用神经网络作为主要的非线性拟合器，输入为用户特征，输出为各种面值券的价值，选出价值最大的券，通过发券系统发送给用户，再由短信提醒的方式，提醒用户去消费，然后在优惠券有效期期间收集用户行为反馈，产生状态转移，将状态转移放入神经网络中训练，通过一段时间的训练达到算法收敛，固定该策略网络作为推荐函数，进行推荐，本发明通过上述设计有效地提高了优惠券的推送精度。
搜索关键词：	优惠券神经网络状态转移非线性拟合策略网络短信提醒发券系统决策问题强化学习算法收敛提醒用户用户特征用户行为有效地放入推送有效期反馈输出智能
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于强化学习的优惠券智能派送方法，其特征在于，包括如下步骤：/nS1、更新数据库，并对数据库中的数据进行清洗，得到用户特征信息；/nS2、利用所述用户特征信息初始化深度神经网络模型；/nS3、利用当前的深度神经网络模型输出优惠券的面值以及优惠券的数量；/nS4、向用户派送面值最大的优惠券，并通过短信的方式提醒用户消费；/nS5、获取在优惠券有效期内用户所反馈的行为信息，并记录该行为信息；/nS6、将用户反馈的行为信息输入至所述深度神经网络模型进行训练，更新深度神经网络模型；/nS7、根据更新后的深度神经网络模型确定策略函数，并根据所述策略函数向用户派送优惠券，从而完成基于强化学习的优惠券智能派送。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911003360.6/，转载请声明来源钻瓜专利网。

上一篇：一种潜在高价值旅客的发现方法及装置
下一篇：一种通过阅读文章领取彩蛋中红包及卡券的活动系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q30-00 商业，例如购物或电子商务
G06Q30-02 .行销，例如，市场研究与分析、调查、促销、广告、买方剖析研究、客户管理或奖励；价格评估或确定
G06Q30-04 .签单或开发票
G06Q30-06 .购买、出售或租赁交易
G06Q30-08 ..拍卖

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于强化学习的优惠券智能派送方法在审

专利文献下载