[发明专利]基于用户数据进行分类分析的方法和装置有效
申请号: | 201810147385.2 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108460630B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 曹木水 | 申请(专利权)人: | 广州虎牙信息科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 511446 广东省广州市番禺区南村镇万博二*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 数据 进行 分类 分析 方法 装置 | ||
本申请提供一种基于用户数据进行分类分析的方法和装置,所述方法包括:搜集用户数据;基于用户数据获取任意两用户之间的相关性;基于所述相关性并通过层次聚类方法将用户划分成若干用户群;对各用户群进行富集分析,确定满足预设的富集条件的用户群。采用本申请的技术方法,可以快速定位并圈定满足需求的用户。
技术领域
本申请涉及数据分析领域,特别涉及一种基于用户数据进行分类分析的方法和装置。
背景技术
在互联网大数据时代,随着数据采集系统的快速发展,用户在游戏、电商、社交网络等产品上进行的任何一个细小的动作行为都可以被捕捉,并生成相应的用户数据记录下来。其中,用户数据包括用户基础属性数据(性别、年龄等)和用户行为数据(消费情况、上线时间等)等。
通过对大量用户数据的分析,可以发掘数据背后隐藏的一些规律,利用这些规律,可以获取更大的利益。比如,在电商平台,通过对某一用户的用户数据进行分析,可以发现该用户的一些习惯与喜好。对于商家来说,可以投其所好,对该用户推销该用户喜欢的产品,对于用户来说,用户可以快速的得到自己喜欢的产品,从而实现双赢,其他很多领域亦然。
在网络游戏中,游戏用户之间通常存在关联,如何利用用户之间的关联性实现利益最大化是游戏服务商十分关注的问题。
发明内容
有鉴于此,本申请提供一种基于用户数据进行分类分析的方法和装置,所述方法可以快速定位并圈定满足需求的用户。
具体地,本申请是通过如下技术方案实现的:
一种基于用户数据进行分类分析的方法,所述方法包括:
搜集用户数据;
基于所述用户数据获取任意两用户之间的相关性;
基于所述相关性并通过层次聚类方法将用户划分成若干用户群;
对各用户群进行富集分析,确定满足预设的富集条件的用户群。
优选地,所述获取两用户之间的相关性的过程包括:
基于用户数据预处理得到各用户特征矩阵,所述用户特征矩阵中包括用户的基础属性特征值、行为特征值、消费特征值;
利用用户特征矩阵计算两用户间的偏相关系数,所述偏相关系数用于描述两用户之间的相关性。
优选地,当所述用户群用于预测待上线活动的效果时,在对各用户群进行富集分析之前,获取预参与所述待上线活动的用户数据,所述用户数据为所述待上线活动预上线时段内参与所述待上线活动的用户所对应的用户数据。
优选地,当所述用户群用于预测待上线活动的效果时,在对各用户群进行富集分析之前,获取预参与所述待上线活动的用户数据,所述用户数据为与所述待上线活动匹配的其他活动的用户数据。
一种基于用户数据进行分类分析的装置,所述装置包括:
搜集单元,用于搜集用户数据;
相关性获取单元,用于基于所述用户数据获取任意两用户之间的相关性;
划分单元,用于基于所述相关性并通过层次聚类方法将用户划分成若干用户群;
分析单元,用于对各用户群进行富集分析,确定满足预设的富集条件的用户群。
其中,在所述装置中,优选地,所述相关性获取单元,具体用于:
基于用户数据预处理得到各用户特征矩阵,所述用户特征矩阵中包括用户的基础属性特征值、行为特征值、消费特征值;
利用用户特征矩阵计算两用户间的偏相关系数,所述偏相关系数用于描述两用户之间的相关性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙信息科技有限公司,未经广州虎牙信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810147385.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置