[发明专利]一种基于深度学习的用户行为预测方法有效
申请号: | 201811365272.6 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109460816B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 王婷;钟力;房鹏展 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06Q10/04 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 用户 行为 预测 方法 | ||
1.一种基于深度学习的用户行为预测方法,其特征在于,包括如下步骤:
步骤一:用户序列数据生成,将每一个购买用户按照访问时间顺序形成一条访问序列数据,这些访问序列就是用户购买产品前的访问习惯;访问序列构成用户序列数据;
步骤二:访问序列数据处理,对步骤一中生成的访问序列数据进行进一步处理,处理过程包括如下步骤: 1)去除不重要的网页模块,对网页模块进行重要性评定,对重要性低于要求的网页模块 需要在访问序列数据中先予以剔除; 2)用户连续相同行为去重,针对具有连续的相同行为的访问序列数据,对其中用户的连 续的相同行为进行去重;
步骤三:训练循环神经网络模型;
训练循环神经网络进行访问序列预测,输入是步骤二中页面访问的访问序列数据,中间输出也是页面访问的访问序列数据,如输出的访问序列数据长度不足,则用不相关的标记补齐,最终输出之前加入 Softmax 层得到访问序列数据对应的购买概率;
所述步骤三中,循环神经网络采用 LSTM 算法模型,使用累加的形式计算状态,训练数据分为两类,分别为购买样本和不购买样本,其数据量分别为 50 万以上;
步骤四:购买概率实时预测, 当用户在网站上有了点击行为之后,通过已经训练好的循环神经网络模型,实时预测出用户下一步可能购买产品的可能性,即购买概率;
所述步骤一中,采用网站日志记录的用户身份 cookie 去识别不同的用户,用户进入网站的一系列点击行为,根据时间先后顺序排列好,形成行为访问序列数据,得到购买和不购买的访问序列数据样本,所述步骤二中,需要剔除的重要性低于要求的网页模块,包括购买行为页面,即支付成功之前必经的页面:填加投保信息页面、投保信息确认页面、支付页面,还包括整个网站页面结构中,很少被用户访问的页面,采用的剔除方法是统计页面最近一个月内被所有用户访问的次数,将访问次数小于等于3的页面去除;
所述步骤二中还包括如下步骤:
3)进一步分析多次购买的数据,对多次购买的数据以购买动作为节点截取出多条购买动作的访问序列数据; 4)确定截断最大访问序列的长度,首先,过滤访问路径不足5步的不购买的访问序列数据,保留有效访问路径至少8步的访问序列数据,不足8步的用空格补齐,选取购买动作往前推 10 步作为访问序列的最大长度,大于10 的访问序列予以截断。
2.如权利要求1 所述的一种基于深度学习的用户行为预测方法,其特征在于:所述步骤四中,当用户的购买概率满足设定的阈值条件时,根据不同业务场景为用户定向推送营销推广方案,所述营销推广方案包括发放优惠券、人工服务、购买引导促销手段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811365272.6/1.html,转载请声明来源钻瓜专利网。