[发明专利]一种基于聚类分析的客户分群实现方法在审
申请号: | 201911421024.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159258A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 吴炎泉;陈思恩;杨紫胜;廖雅哲 | 申请(专利权)人: | 科技谷(厦门)信息技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06Q30/02;G06K9/62 |
代理公司: | 厦门致群专利代理事务所(普通合伙) 35224 | 代理人: | 刘兆庆;邓贵琴 |
地址: | 361006 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 聚类分析 客户 分群 实现 方法 | ||
本发明公开了一种基于聚类分析的客户分群实现方法,包括以下步骤:建立标签画像系统;获取待分群的客户数据集;选择客户标签,生成初始客户标签库;配置聚类数目K,并选择是否对初始客户标签库的标签进行降维;利用主成分分析法对待分析客户标签库中的连续型标签进行降维处理,对类别型标签进行One‑Hot编码,生成最终客户标签库;于最终客户标签库,利用k‑means++算法进行聚类分析,生成聚类结果并进行展示。本发明能够让业务人员从客户标签体系中筛选出客户标签作为聚类特征,并进行简单配置后,即可自动完成客户聚类分群,将聚类分群结果展示到前台,呈现给业务人员,整个过程操作简便,极大的节约了时间成本。
技术领域
本发明涉及聚类分析技术领域,特别涉及一种基于聚类分析的客户分群实现方法。
背景技术
客户分群是指企业在明确的战略业务模式和特定的市场中,根据客户的属性、行为、需求、偏好以及价值等因素对客户进行分类,进而提供有针对性的产品,服务和销售模式。使用客户分群系统,能让业务人员在无需了解客户群体特征的情况下,对客户进行聚类,将聚类结果展示到前台,并为各客户群体打上类别标签,从而能够对每个群体制定差异化的营销和关怀策略。
传统的聚类分析算法需要数据分析专家,基于深厚的行业知识和对数据的理解,使用分析工具读取数据,进行人工特征工程,构建定制化机器学习算法。在整个过程中,步骤较为繁琐,业务人员无法单独完成,数据分析师需要根据不同业务背景与不同的业务组进行深入的交流以保证聚类结果符合业务逻辑。
发明内容
为解决上述问题,本发明提供了一种基于聚类分析的客户分群实现方法。
本发明采用以下技术方案:
一种基于聚类分析的客户分群实现方法,其包括以下步骤:
S1、建立标签画像系统,所述标签画像系统采用宽表形式存储,其包含有一组客户标签,所述客户标签包括连续型标签和类别型标签;
S2、获取待分群的客户数据集;
S3、基于业务背景,在标签画像系统里的标签列表中选择客户标签,生成初始客户标签库;
S4、配置聚类数目K,并选择是否对初始客户标签库的标签进行降维;
S5、利用主成分分析法对待分析客户标签库中的连续型标签进行降维处理,对类别型标签进行One-Hot编码,生成最终客户标签库;
S6、基于最终客户标签库,建立聚类分析模型,利用k-means++算法进行聚类分析,生成聚类结果并进行展示,所述聚类结果包括聚类后的各群体数量以及各群体标签的中心值。
优选地,步骤S1中所述的建立标签画像系统具体为:创建HBase表,然后将HBase表映射到Hive表。
优选地,步骤S5中所述的降维处理通过以下方法实现:
S51、对初始客户标签库中的连续型标签作为原始变量,进行进行标准化处理,令:
将p个原始变量X1,X2,…,Xp的总方差分解成p个相互独立的变量Y1,Y2,…,Yp的方差之和;
S52、建立贡献率计算模型如下:
其中,为变量Y1,Y2,…,Ym的的累计贡献率,m为选取的主成分变量的数量,mp;
S53、基于预先设定的贡献率阈值,利用所述贡献率计算模型计算累计贡献率达到贡献率阈值时的m值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科技谷(厦门)信息技术有限公司,未经科技谷(厦门)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911421024.3/2.html,转载请声明来源钻瓜专利网。