[发明专利]网络业务用户群组划分的方法和装置有效
申请号: | 201410307390.7 | 申请日: | 2014-06-30 |
公开(公告)号: | CN105281925B | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 杨向勇;艾志兵;刘黎春;陈川 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04L12/18 | 分类号: | H04L12/18;H04L12/24 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;张颖玲 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 业务 用户 划分 方法 装置 | ||
1.一种网络业务用户群组划分的方法,其特征在于,包括步骤:
获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标,并将所述属性和/或行为数据转换为标准化数据;
根据所述标准化数据,确定多个群组中心点,将所述标准化数据划分到距离最近的群组中心点所在群组;
对所述各个群组中的标准化数据的差异性进行分析,确定各个群组的群组特征;
根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息。
2.如权利要求1所述的网络业务用户群组划分的方法,其特征在于,所述对所述各个群组中的标准化数据的差异性进行分析,确定各个群组的群组特征的步骤包括:
根据所述各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同一个统计指标的偏差概率大小,获取所述统计指标的偏差概率较其他群组差异最显著的群组,将所述统计指标的数值特征作为该群组的群组特征。
3.如权利要求2所述的网络业务用户群组划分的方法,其特征在于,所述属性和/或行为数据包括:
U1=(X11,X21,……,Xj1,……,Xm1);
U2=(X12,X22,……,Xj2,……,Xm2);
……;
Ui=(X1i,X2i,……,Xji,……,Xmi);
……;
Un=(X1n,X2n,……,Xjn,……,Xmn);
其中,i为用户的序号,n为获取的用户总个数,Ui为第i个用户的属性和/或行为数据,j为属性和/或行为数据的统计指标的序号,m为属性和/或行为数据的统计指标的总个数,Xj为第j个统计指标的属性和/或行为数据,Xji为第i个用户的第j个统计指标的属性和/或行为数据。
4.如权利要求3所述的网络业务用户群组划分的方法,其特征在于,当所述属性和/或行为数据为连续型数据时,所述将属性和/或行为数据转换为标准化数据采用以下公式:
Xji标准=(Xji-Xjmin)÷(Xjmax-Xjmin);
Ui标准=(X1i标准,X2i标准,……,Xji标准,……,Xmi标准);
其中,Xji标准为Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据。
5.如权利要求3所述的网络业务用户群组划分的方法,其特征在于,当所述属性和/或行为数据为分类型数据时,所述将属性和/或行为数据转换为标准化数据采用以下步骤:
对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一类,分类后的取值包括Y1、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的分类序号,Ye为第e类取值;
判断f是否小于或等于2;
当f小于或等于2时,判断Y1和Y2是否仅为0或1;
如果是,则无需数值转换,原属性和/或行为数据作为标准化数据Xji;
如果否,则将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的数据作为标准化数据Xji;
当f大于2时,若所述属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye之外的取值为0,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将所述属性和/或行为数据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以获得标准化数据Xji标准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410307390.7/1.html,转载请声明来源钻瓜专利网。