[发明专利]一种用户分类方法、装置及电子设备在审
申请号: | 201810095690.1 | 申请日: | 2018-01-31 |
公开(公告)号: | CN110097066A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 张祺 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行为特征数据 消息访问 用户分类 装置及电子设备 传统人工 分类结果 用户聚类 用户类型 主观性 记录 分类 申请 | ||
1.一种用户分类方法,其特征在于,包括:
收集用户的消息访问记录,并从所述的消息访问记录中提取所述用户的行为特征数据;
基于所述行为特征数据,采用预先训练的用户聚类模型,将所述用户划分到对应的用户类型中。
2.根据权利要求1所述的用户分类方法,其特征在于,所述预先训练的用户聚类模型,采用如下方式训练获得:
收集待分类用户的消息访问记录,并从所述消息访问记录中提取所述用户的行为特征数据;
从所述行为特征数据中选取抽样数据,根据所述抽样数据采用聚类算法训练,获得所述用户聚类模型。
3.根据权利要求2所述的用户分类方法,其特征在于,所述收集用户的消息访问记录,包括将用户识别出来并进行保存;其中,通过下述任一渠道获取用于识别用户的信息:用户注册ID、邮箱、手机号、第三方登录信息、cookie。
4.根据权利要求2所述的用户分类方法,其特征在于,所述用户来源于下述任意一种用户群体:
注册用户、活跃设备用户、应用消息推送的目标用户群体、广告投放的目标用户群体、用户权益投放的目标用户群体。
5.根据权利要求2所述的用户分类方法,其特征在于,所述用户的消息访问记录,包括用户对接收到的消息推送进行响应的消息访问记录;所述消息推送至少包括下述任一种消息推送类型:
应用消息推送;
广告投放推送;
用户权益推送;
用户访问业务时的相似业务推荐;
用户访问业务时的相似产品推荐。
6.根据权利要求2所述的用户分类方法,其特征在于,所述收集用户的消息访问记录,包括如下渠道的至少一种:
从日志服务器收集所述用户的消息访问记录;
从消息服务器收集所述用户的消息访问记录;
从存储设备或单元上收集所述用户的消息访问记录。
7.根据权利要求2所述的用户分类方法,其特征在于,所述的提取所述用户的行为特征数据,包括:从以下维度中的至少一个维度提取所述用户的行为特征数据:
推送消息发送时间、消息到达至用户打开时间、消息的推送渠道、用户页面停留时长、用户机型、用户打开消息使用的网络类型、推送消息内容的业务类型。
8.根据权利要求7所述的用户分类方法,其特征在于,所述的提取所述用户的行为特征数据,还包括按照预定格式对所述行为特征数据进行数据转换,至少包括下述数据转换方式的一种:
所述的消息的推送渠道的特征取值预定格式采用离散化数值表示;
所述的用户页面停留时长的特征取值采用以秒标记的正整数格式;
所述的用户机型的特征采用离散化数值表示;
所述的用户打开消息使用的网络类型采用离散化数值表示。
9.根据权利要求1所述的用户分类方法,其特征在于,所述的聚类算法,采用高斯混合模型作为用户聚类模型。
10.根据权利要求9所述的用户分类方法,其特征在于,所述用户聚类模型的参数包括:所述用户聚类模型的各个聚类的概率中心、所述各个聚类的协方差、所述各个聚类概率在所述用户聚类模型中的权重;所述根据所述抽样数据采用聚类算法训练用户聚类模型,包括下述步骤:
确定所述的用户聚类模型参数的初始化值;
确定所述用户聚类模型的收敛条件;
基于所述抽样数据和所述初始化值,通过迭代方法计算所述用户聚类模型的参数,直到所述用户聚类模型满足所述收敛条件;
其中,所述收敛条件中包括相似性值和收敛性判断阈值;所述收敛性判断阈值,是根据所述用户聚类模型的精度要求和计算成本定义的常量;所述的相似性值,是评定本轮迭代和上一轮迭代得到的用户聚类模型的相似程度的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810095690.1/1.html,转载请声明来源钻瓜专利网。