[发明专利]数据分析的方法及装置在审
申请号: | 202111178222.9 | 申请日: | 2021-10-09 |
公开(公告)号: | CN114004629A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 陈升 | 申请(专利权)人: | 深圳思为科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分析 方法 装置 | ||
1.一种数据分析的方法,其特征在于,包括:
获取用户数据;
将所述用户数据分为特征数据和行为数据;
对所述特征数据进行数据预处理,得到第一数据集合,所述第一数据集包含用户的特征类型及其对应的特征值;
对所述第一数据集进行特征工程处理,得到第二数据集合,所述特征工程处理是对所述特征类型及其对应的所述特征值征进行特征分桶的过程,所述特征分桶是指对相似的所述特征类型及其对应的所述特征值进行聚合,所述第二数据集合包含关键特征及其对应的关键特征值;
将所述行为数据导入所述行为预测模型以预测所述用户的行为分;
利用所述第二数据集合确定所述用户的所述关键特征及其对应的所述关键特征值;
利用所述关键特征及其对应的所述关键特征值以及所述用户的行为分,建立用户打分表。
2.根据权利要求1所述的方法,其特征在于,所述获取用户数据,包括:采用埋点的方式从目标终端自动获取所述用户数据;
所述埋点是指在数据分析点监听目标终端的事件,所述事件用于指示所述目标终端所执行的业务操作,所述采集点是指期望从所述业务操作中捕获的目标事件。
3.根据权利要求2所述的方法,其特征在于,所述采用埋点的方式从目标终端自动获取所述用户数据之后,所述方法还包括:数据抽取、数据转换和数据加载;其中,
所述数据抽取是指从数据库中获取所述用户数据的过程;
所述数据转换是指对所述用户数据按照预先设计好的规则将抽取的数据进行数据格式和维度的转换,使本来异构的数据格式能统一起来;
所述是指将转换完数据按计划增量或全部导入到数据库中。
4.根据权利要求1所述的方法,其特征在于,所述对所述特征数据进行数据预处理,包括:
利用机器学习的算法和模型对所述特征数据进行训练,得到特征值;
根据所述特征值从大到小选择对应的所述特征类型。
5.根据权利要求1所述的方法,其特征在于,所述对所述第一数据集进行特征工程处理,包括:
通过证据权重WOE对所述特征值进行数值特征分桶;
通过目标编码对所述特征类型进行类型特征分桶。
6.根据权利要求5所述的方法,其特征在于,所述方法之后还包括:
根据所述特征分桶计算每个特征的对比值,得到所述第二数据集合,所述对比值是指在所述特征分桶中具有某一特征的用户所占比例与总体中具有相同特征的用户所占比例的比值;
所述对比值是使用目标群体指数TGI表征,所述TGI用于指示研究所述特征和目标人群的关联度。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述用户得分表和所述第二数据集合,选择作为雷达图的展示字段;
所述雷达图用于指示所述用户的关键行为和诉求。
8.一种数据分析的装置,其特征在于,包括:
监听单元,在数据分析点监听目标终端的事件,所述事件用于指示所述目标终端所执行的业务操作,所述采集点是指期望从所述业务操作中捕获的目标触发事件;
采集单元,所述采集单元与所述监听单元相连接,用于采集所述用户数据;
数据存储单元,所述数据存储单元与所述采集单元连接,用于存储所述用户数据;
数据分析单元,所述数据分析单元与所述数据存储单元连接,用于利用所述数据存储单元内的所述用户数据进行特征工程处理和行为预测模型训练,所述特征工程处理是对所述特征类型及其对应的所述特征值征进行特征分桶的过程,所述行为预测模型可用于用户行为打分和预测;
数据查询单元,所述数据查询单元与所述数据存储单元相连接,用于实现所述用户数据的自由查询。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳思为科技有限公司,未经深圳思为科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111178222.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置