[发明专利]基于多维度数据的彩票用户流失预测方法及其系统在审
申请号: | 201710078856.4 | 申请日: | 2017-02-14 |
公开(公告)号: | CN106997493A | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 谭浩宇;韩旭;宋骁程 | 申请(专利权)人: | 云数信息科技(深圳)有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/34;G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 麦小婵,郝传鑫 |
地址: | 518000 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多维度数据的彩票用户流失预测方法,包括采集原始用户数据,对原始用户数据进行抽取和转换后,以指定格式分类加载至数据库;对进行预处理后的多维度用户数据进行迭代测试,提取与用户流失相关的潜在特征,获得特征集;基于时间维度将特征集划分为训练集、验证集和测试集;基于训练集进行逻辑回归建模,获得多组预测模型;将验证集分别输入至所述预测模型中,将准确度最高的一组预测模型作为最终的用户流失评估模型;将所述测试集输入至用户流失评估模型中,对用户流失情况进行预测。本发明还提供了一种基于多维度数据的彩票用户流失预测系统。实施本发明提供的技术方案,可以降低预测的难度和提高预测的准确率。 | ||
搜索关键词: | 基于 多维 度数 彩票 用户 流失 预测 方法 及其 系统 | ||
【主权项】:
一种基于多维度数据的彩票用户流失预测方法,其特征在于,包括:采集原始用户数据,对所述原始用户数据进行抽取和转换后,以指定格式分类加载至数据库;对所述原始用户数据进行预处理,包括:检测数据的一致性和剔除异常值;对数据库中存储的数据进行除重处理,过滤重复数据;对所述原始用户数据进行聚集和规范化变换,获得多维度用户数据;所述多维度用户数据包括用户个人信息,历史投入信息和历史产出信息;对进行预处理后的多维度用户数据进行迭代测试,提取与用户流失相关的潜在特征,并对所述潜在特征进行调整、筛选和组合,获得与用户流失相关的特征集;基于时间维度,将所述特征集划分为训练集、验证集和测试集;基于所述训练集进行逻辑回归建模,获得多组预测模型;将所述验证集分别输入至所述多组预测模型中,比较各组预测模型的准确度,并将准确度最高的一组预测模型作为最终的用户流失评估模型;将所述测试集输入至所述用户流失评估模型中,对用户流失情况进行预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云数信息科技(深圳)有限公司,未经云数信息科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710078856.4/,转载请声明来源钻瓜专利网。
- 上一篇:具有排烟装置的电焊机
- 下一篇:一种新型钢筋焊接装置
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理