[发明专利]用户分群方法、装置、设备及存储介质在审
申请号: | 202011201399.1 | 申请日: | 2020-11-02 |
公开(公告)号: | CN112308703A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 张发恩;周杰;陈斌斌 | 申请(专利权)人: | 创新奇智(重庆)科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 衡滔 |
地址: | 400000 重庆市九龙坡区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 分群 方法 装置 设备 存储 介质 | ||
本申请提供一种用户分群方法、装置、设备及存储介质,其中,用户分群方法包括步骤:获取若干个用户的信贷数据;对若干个用户的信贷数据进行粗粒度分群,以将若干个用户的信贷数据划分为m个类别的信贷数据;根据预设模型对m个类别的信贷数据进行聚类,以将m个类别的信贷数据进行划分,得到m*n个类别的信贷数据;合并m*n个类别的信贷数据,以得到若干个用户的信贷数据的分组结果;根据述若干个用户的信贷数据的分组结果确定若干个用户的信贷类型。本申请能够把用户分成不同且不重合的若干个群体,并保证了每个群体的数目处于相同规模大小,以使得采用不同的群体数据分别进行机器学习建模时,能够提高模型针对用户信贷风险的评估精确性。
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种用户分群方法、装置、设备及存储介质。
背景技术
现有分群方法目的是归类相似客户用以发现潜在客户或者设计针对不同客户的差异化销售/推销策略,结果是归类结果满足了业务可解释性,群体内相似性,群体间差异性。但是缺点是这种分群结果并不能帮助后续针对模型的训练效果提升,即无法提高模型针对用户信贷风险的评估精确性。
发明内容
本申请实施例的目的在于提供一种用户分群方法、装置、设备及存储介质,用以把用户分成不同且不重合的若干个群体,并保证了每个群体的数目处于相同规模大小,以使得采用不同的群体数据分别进行机器学习建模时,能够提高模型针对用户信贷风险的评估精确性。
为此,本申请提供一种用户分群方法,所述方法包括步骤:
获取若干个用户的信贷数据;
对所述若干个用户的信贷数据进行粗粒度分群,以将所述若干个用户的信贷数据划分为m个类别的信贷数据,其中,m大于等于1,且m为整数;
根据预设模型对所述m个类别的信贷数据进行聚类,以将所述m个类别的信贷数据进行划分,得到m*n个类别的信贷数据,其中,n大于等于1,且n为整数;
合并所述m*n个类别的信贷数据,以得到所述若干个用户的信贷数据的分组结果;
根据述若干个用户的信贷数据的分组结果确定所述若干个用户的信贷类型。
本申请第一方面的用户分群方法能够若干个用户的信贷数据划分为m个类别的信贷数据,进而再将m个类别的信贷数据换分为m*n个类别的信贷数据,进而通过将m*n个类别的信贷数据合并,进而将若干个用户的信贷数据的划分为规模大小类似或者相同的群体数据并将其作为分组结果,进而根据分组结果能够更加精确地确定用户的信贷类型,即确定用户的信贷风险等级。
在本申请第一方面中,作为一种可选的实施方式,所述对所述若干个用户的信贷数据进行粗粒度分群,以将所述若干个用户的信贷数据划分为m个类别的信贷数据,包括步骤:
依次根据每个所述用户的信贷数据中的字段值确定每个所述用户的信贷数据的空值状态矩阵;
根据无监督聚类算法对所述空值状态矩阵进行无监督聚类,以得到所述空值状态矩阵的m个类别;
根据所述空值状态矩阵的m个类别将所述若干个用户的信贷数据划分为m个类别的用户信贷数据。
在本可选的实施方式中,通过根据每个用户的信贷数据中的字段值确定每个用户的信贷数据的空值状态矩阵,进而根据无监督聚类算法可对空值状态矩阵进行无监督聚类而得到空值状态矩阵的m个类别,进而根据空值状态矩阵的m个类别将若干个用户的信贷数据划分为m个类别的用户信贷数据。
在本申请第一方面中,作为一种可选的实施方式,所述无监督聚类算法为K均值聚类算法或高斯混合算法。
在本可选的实施方式中,通过K均值聚类算法或高斯混合算法可对空值状态矩阵进行无监督聚类而得到空值状态矩阵的m个类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(重庆)科技有限公司,未经创新奇智(重庆)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011201399.1/2.html,转载请声明来源钻瓜专利网。