[发明专利]一种针对B2B平台用户的会员流失预警方法和系统在审
申请号: | 202211181162.0 | 申请日: | 2022-09-27 |
公开(公告)号: | CN115511525A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 程夏莹;文扬;王来;黄天立;王汇丰;宋希;盛颖涵;朱彭生;万仕龙 | 申请(专利权)人: | 欧冶云商股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/00;G06N20/00;G06K9/62 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 夏健君 |
地址: | 201999 上海市宝山区漠*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 b2b 平台 用户 会员 流失 预警 方法 系统 | ||
1.一种针对B2B平台用户的会员流失预警方法,其特征在于,包括以下步骤:
大数据提取和清洗步骤:接收B2B平台的原始数据并进行数据清洗和预处理,所述B2B平台的原始数据包括会员基础信息、交易数据、行为数据、违约数据和用户负面体验数据;
数据标注步骤:在所述原始数据中对部分数据进行流失用户和非流失用户的标注,得到训练样本;并通过非监督机器学习模型进行自动化数据标注,扩充所述训练样本;
特征筛选步骤:根据所述原始数据构建特征,采用保留数据原始属性的特征筛选方法,从业务完整度和数据质量层面进行特征筛选;
模型选择步骤:基于召回率评价指标从多个经典机器学习方法中进行模型筛选;
主模型构建步骤:根据筛选出的特征和模型,基于训练样本进行模型迭代优化;
流失预警步骤:根据训练好的模型对各个会员的B2B平台数据进行流失概率计算,根据计算出的流失概率发出预警提示。
2.根据权利要求1所述的一种针对B2B平台用户的会员流失预警方法,其特征在于,所述数据清洗和预处理过程包括对原始数据进行缺失值处理、异常数据处理、标准化、归一化、信息量分析、数据分布和类别特征编码处理。
3.根据权利要求1所述的一种针对B2B平台用户的会员流失预警方法,其特征在于,所述保留数据原始属性的特征筛选方法包括方差分析、相关系数法、卡方检验法、信息熵、基尼系数、过滤法和嵌入法。
4.根据权利要求1所述的一种针对B2B平台用户的会员流失预警方法,其特征在于,从业务完整度层面进行特征筛选具体为:筛选预先设定的重要特征;
从数据质量层面进行特征筛选具体为:在特征筛选过程中,结合方差、标准差、数据缺失程度、特征相关性及通过集成算法训练筛选相结合的方式进行。
5.根据权利要求4所述的一种针对B2B平台用户的会员流失预警方法,其特征在于,所述重要特征包括:账户信息、采购数据、负面信息、采购偏好、行为数据、违约数据、工商财经数据、时长行情数据和天气季节数据。
6.根据权利要求1所述的一种针对B2B平台用户的会员流失预警方法,其特征在于,根据原始数据构建的特征包括:会员用户的交易数据、卖家的挂货数据、平台的功能数据、金融服务、后期的售后、物流、仓储、票据、大盘数据、天气数据以及工商信息。
7.根据权利要求1所述的一种针对B2B平台用户的会员流失预警方法,其特征在于,筛选出的模型为XGboost算法模型。
8.一种针对B2B平台用户的会员流失预警系统,其特征在于,包括:
大数据提取和清洗模块,被配置为:接收B2B平台的原始数据并进行数据清洗和预处理,所述B2B平台的原始数据包括会员基础信息、交易数据、行为数据、违约数据和用户负面体验数据;
数据标注模块,被配置为:在所述原始数据中对部分数据进行流失用户和非流失用户的标注,得到训练样本;并通过非监督机器学习模型进行自动化数据标注,扩充所述训练样本;
特征筛选模块,被配置为:根据所述原始数据构建特征,采用保留数据原始属性的特征筛选方法,从业务完整度和数据质量层面进行特征筛选;
模型选择模块,被配置为:基于召回率评价指标从多个经典机器学习方法中进行模型筛选;
主模型构建模块,被配置为:根据筛选出的特征和模型,基于训练样本进行模型迭代优化;
流失预警模块,被配置为:根据训练好的模型对各个会员的B2B平台数据进行流失概率计算,根据计算出的流失概率发出预警提示。
9.根据权利要求8所述的一种针对B2B平台用户的会员流失预警系统,其特征在于,所述数据清洗和预处理过程包括对原始数据进行缺失值处理、异常数据处理、标准化、归一化、信息量分析、数据分布和类别特征编码处理;
所述保留数据原始属性的特征筛选方法包括方差分析、相关系数法、卡方检验法、信息熵、基尼系数、过滤法和嵌入法。
10.根据权利要求8所述的一种针对B2B平台用户的会员流失预警系统,其特征在于,从业务完整度层面进行特征筛选具体为:筛选预先设定的重要特征;
从数据质量层面进行特征筛选具体为:在特征筛选过程中,结合方差、标准差、数据缺失程度、特征相关性及通过集成算法训练筛选相结合的方式进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于欧冶云商股份有限公司,未经欧冶云商股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211181162.0/1.html,转载请声明来源钻瓜专利网。