[发明专利]一种面向精准营销的电信用户消费画像的构建方法有效
申请号: | 201710623442.5 | 申请日: | 2017-07-27 |
公开(公告)号: | CN107358269B | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 余阳;朱李设;吴晓鹏 | 申请(专利权)人: | 广州天源信息科技股份有限公司;中山大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02;G06Q50/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 裘晖;林梅繁 |
地址: | 510520 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 精准 营销 电信用户 消费 画像 构建 方法 | ||
1.一种面向精准营销的电信用户消费画像的构建方法,其特征在于,包括以下步骤:
步骤S1、对用户话单数据做数据预处理,得到用户消费行为数据;
步骤S2、将用户话单数据和新套餐计费规则作为离线计费引擎的输入,计算用户在新套餐下消费额,利用新旧套餐下消费差额给用户标定类标签;
步骤S3、利用用户消费行为数据和所标定的相应类标签,训练新套餐的随机森林模型;
步骤S4、通过随机森林模型筛选重要特征,得到重要特征集合;
步骤S5、针对每个重要特征,计算新套餐的非潜在用户和潜在用户的分裂点;
步骤S6、利用重要特征和相应分裂点构建新套餐的潜在用户的用户画像;
所述步骤S4中,通过随机森林模型筛选重要特征时,计算特征重要性的方法如下:
若随机森林中共有n棵树,特征个数为m:
S41、对于n棵树中的每棵树以及m个特征中的每个特征,计算特征重要性;特征i在树j中的重要性记为Imp(i_j)=sum(gain*num),1≤i≤m,1≤j≤n,其中gain是树j中在特征i分裂的节点的信息增益,num是经过该节点的实例个数;
S42、将每棵树中的m个特征的重要性归一化到总和为1,得到每棵树的重要性向量,树j的重要性向量记为vj;
S43、对步骤S42所求得的n个向量求均值,得到n棵树的平均重要性向量v=(v1+v2+……+vn)/n;
S44、将平均重要性向量中的m个元素归一化到总和为1;
两次归一化使用的方法都是Z-score标准化方法;
所述步骤S5的方法如下:
对于给定样本集D和重要特征A,假定重要特征A在样本集D上出现n个不同的取值,将这些值从小到大排序,记为{a1,a2,……,an},选取[ai,ai+1)的中位点(ai+ai+1)/2为分裂点,分裂点将{a1,a2,……,an}划分为大于分裂点和小于分裂点两类,记为+、-两类;对于{a1,a2,……,an}每两个相邻点,都计算得到一个分裂点,共n-1个分裂点;选择信息增益最大的分裂点a作为最终的分裂点:
2.根据权利要求1所述的构建方法,其特征在于,所述步骤S1中,对用户话单数据做数据预处理,包括:
对用户话单数据做特征筛选,剔除与用户消费行为无关的特征;
对于缺失值,如果缺失值是数值型的,则根据该属性在其他所有对象的取值的平均值来填充该缺失的属性值;如果缺失值是非数值型的,则根据统计学中的众数原理,用该属性在其他所有对象的取值次数最多的值来补齐该缺失的属性值。
3.根据权利要求1所述的构建方法,其特征在于,所述步骤S2的处理方法如下:
将用户在目前套餐下的消费话单和新套餐计费规则作为离线计费引擎的输入,计算用户基于目前的消费行为习惯、新套餐计费规则的消费额;用户在目前套餐下的消费额记为Consum1,在新套餐计费规则下的消费额记为Consum2;
如果Consum1Consum2,将类标签标定为1,表示该用户是新套餐的潜在用户;如果Consum1≤Consum2,将类标签标定为0,表示该用户不是新套餐的潜在用户。
4.根据权利要求1所述的构建方法,其特征在于,所述步骤S4中,通过随机森林模型筛选重要特征时,将特征的重要性按照降序排序,取前面若干个特征作为重要特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州天源信息科技股份有限公司;中山大学,未经广州天源信息科技股份有限公司;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710623442.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:活性炭吸附罐
- 下一篇:一种钡盐废水综合处理站