[发明专利]一种面向混合属性的移动用户动态模糊聚类方法在审
申请号: | 201810090695.5 | 申请日: | 2018-01-30 |
公开(公告)号: | CN108388911A | 公开(公告)日: | 2018-08-10 |
发明(设计)人: | 徐光侠;张令浩;刘俊;马创;吴新凯;陶荆朝;王尧 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02;G06Q50/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行为相似度 移动用户 隶属度 群组 定义用户 动态模糊 混合属性 分群 聚类 方法分析 分类权重 距离度量 模糊聚类 属性系数 行为属性 用户属性 相似度 权重 算法 模糊 衡量 | ||
1.一种面向混合属性的移动用户动态模糊聚类方法,其特征在于,包括以下步骤:
S1:针对传统的模糊聚K-Prototypes算法处理非对称标型数据之间相异度时误差较大的问题,使用属性权重系数;
S2:基于步骤S1所述一种属性权重系数,定义属性权重系数计算方法,按照用户属性比例初步计算各类属性权重;
S3:根据步骤S2所述一种属性权重系数计算方法,定义相异度计算方法在处理用户之间的相异度时使用欧氏距离度量数值型数据之间的距离,使用海明距离度量对称型标型数据间的距离,使用Jaccard距离度量非对称型标型数据间的距离;
S4:使用步骤S3定义的相异度计算方法,定义模糊聚类的目标函数,使用用户各类属性将用户初步划分到相应的簇中;
S5:根据步骤S4划分的模糊聚类结果,通过用户行为属性定义用户行为相似度来衡量用户间的相似性;
S6:根据S5中定义的用户行为相似性来定义模糊隶属度,并通过最大化检测函数,实现根据用户的行为进行进一步的模糊划分,并根据模糊隶属度更新聚类中心,定义用户平均隶属度阈值,检测是否需要增加新的群组,同时带入到S6定义的检测函数中,通过多次迭代将检测函数最大化并最终满足迭代终止条件从而实现动态划分群组。
2.根据权利要求1中所述一种面向混合属性的移动用户动态模糊聚类方法,其特征在于:首先根据用户的混合属性集进行初始模糊聚类,再通过定义的用户平均隶属度动态的划分用户群体。
3.根据权利要求1中所述一种面向混合属性的移动用户动态模糊聚类方法,所述步骤S2中定义属性权重系数计算方法的步骤如下:
令X={X1,X2,X3,...,Xn}表示具有n个用户X的数据集,其中Xi=[xi1,xi2,…,xip,xi(p+1),…,xiq,xi(q+1),…,xm]表示第i个用户X的m个属性值,其中标号为1至p下标的属性为数值型数据属性,p+1到q下标的属性为一般对称标型数据属性,q+1到m下标的属性为特殊标型数据属性;
S21:定义数值型属性权重系数计算方法为:
其中,p为数值型属性个数,q为一般对称标型数据属性个数,r为特殊标型数据属性个数;
S22:定义一般对称标型数据属性权重系数计算方法为:
其中,p为数值型属性个数,q为一般对称标型数据属性个数,r为特殊标型数据属性个数;
S23:定义特殊对称标型数据属性权重系数计算方法为:
其中,p为数值型属性个数,q为一般对称标型数据属性个数,r为特殊标型数据属性个数。
4.根据权利要求1中所述一种面向混合属性的移动用户动态模糊聚类方法,所述步骤S3中定义属性权重系数计算方法的步骤如下:
S31:定义相异度计算方法为:
其中Vl为第l个群组中心,xij为第i个用户的第j个属性,clj为第l个中心的第j个属性,其中,p为数值型数据属性的个数,q为对称标型数据属性的个数,r为对特殊标型数据属性数据属性的个数,δ(xij,clj)采用海明距离,属性相同时值为1,不同时值为0。
S32:根据S31中定义的类间距离计算公式,采用Jaccard距离度量变量之间的距离:
其中Xi为第i个用户,Vl为第个l中心点,t为标型数据个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810090695.5/1.html,转载请声明来源钻瓜专利网。