[发明专利]一种划分客户群集的计算机实现的方法和系统有效
申请号: | 201110080939.X | 申请日: | 2011-03-31 |
公开(公告)号: | CN102737327A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 张斌;谢明;尹文君;董进;杰奎琳.G.莫里斯;曹恒 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 划分 客户 群集 计算机 实现 方法 系统 | ||
1.一种用于划分客户群集的计算机实现的方法,包含:
接收一个原始客户记录集合,其中,客户记录集合中的每个客户记录代表一个客户,每个客户记录包含至少一个数据属性,每个数据属性有一个属性值;
对原始客户记录集合进行预处理,以生成预处理后的客户记录集合;
对预处理后的客户记录集合执行一个聚类算法,将预处理后的客户记录集合划分成预定个数的群集,
其中,所述预处理包含:
确定原始客户记录集合中的每个客户记录所代表的客户的类型;
在相应的客户记录中用一个类型属性表示该客户的类型;
对数据属性和类型属性的值进行归一化;
对数据属性的值和类型属性的值分别加权,获得数据属性的加权属性值和类型属性的加权属性值。
2.权利要求1的方法,其中,所述在相应的客户记录中用一个类型属性表示该客户的类型,包含在相应的客户记录中增加一个类型属性。
3.权利要求1的方法,其中,所述对数据属性的值和类型属性的值分别加权,包含用散度权重因子α对数据属性的属性值加权,用纯度权重因子β,对类型属性的属性值加权,其中α+β=1。
4.权利要求1-3任何之一的方法,其中,所述聚类算法是K均值聚类算法。
5.权利要求4的方法,其中,所述预定个数是从一个指定范围中选择的整数。
6.权利要求1的方法,进一步包含:
从所述预定个数的群集中选择纯度较高的群集,输出该群集中的原始客户记录的数据属性的值,其中,一个群集的纯度,是该群集中的具有特定的类型属性的客户记录占该群集中的总客户记录数的比率。
7.一种用于划分客户群集的系统,包含:
接收装置,被配置得用于接收一个原始客户记录集合,其中,客户记录集合中的每个客户记录代表一个客户,每个客户记录包含至少一个数据属性,每个数据属性有一个属性值;
预处理装置,被配置得用于对原始客户记录集合进行预处理,以生成预处理后的客户记录集合;
聚类装置,被配置得用于对预处理后的客户记录集合执行一个聚类算法,将预处理后的客户记录集合划分成预定个数的群集,
其中,所述预处理装置包含:
类型表示装置,被配置得用于确定原始客户记录集合中的每个客户记录所代表的客户的类型,在相应的客户记录中用一个类型属性表示该客户的类型;
归一化装置,被配置得用于对数据属性和类型属性的值进行归一化;
加权装置,被配置得用于对数据属性的值和类型属性的值分别加权,获得数据属性的加权属性值和类型属性的加权属性值。
8.权利要求7的系统,其中,所述类型表示装置进一步被配置得用于在相应的客户记录中增加一个类型属性。
9.权利要求7的系统,其中,所述加权装置被配置得用于用散度权重因子α对数据属性的属性值加权,用纯度权重因子β,对类型属性的属性值加权,其中α+β=1。
10.权利要求7-9任何之一的系统,其中,所述聚类算法是K均值聚类算法。
11.权利要求10的系统,其中,所述预定个数是从一个指定范围中选择的整数。
12.权利要求10的系统,进一步包含:
输出装置,被配置得用于从所述预定个数的群集中选择纯度较高的群集,输出该群集中的原始客户记录的数据属性的值,其中,一个群集的纯度,是该群集中的具有特定的类型属性的客户记录占该群集中的总客户记录数的比率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110080939.X/1.html,转载请声明来源钻瓜专利网。