[发明专利]一种分类方法及装置在审
申请号: | 202011399123.9 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112559854A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 蔡一欣;许翀;张溶芳;李堃 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06Q50/32 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;冯建基 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分类 方法 装置 | ||
本申请公开了一种分类方法及装置,分类方法包括:基于用户的通信消费数据和预设特征维度构建一级特征向量,依据一级特征向量和预设特征阈值,获得二级特征向量;对二级特征向量进行标准化处理,获得标准化特征向量;基于因子分解机模型和标准化特征向量,获得组合特征向量,并对多个用户的组合特征向量进行聚类处理,获得用户分类,充分地利用了运营商自身数据实现用户分类,避免通过异业合作商获取数据时需要获取授权,且数据的准确度和实时性无法保障的问题。
技术领域
本申请涉及互联网信息技术领域,具体涉及一种分类方法及装置。
背景技术
针对不同类型的用户制定个性化的管理方式,可以有效提升管理效率。目前,运营商在对用户进行分类时,主要通过对用户的社交和网络行为特征进行分析,确定用户偏好,从而根据用户偏好对用户进行分类。在这种分类方式中,运营商通常需要获取异业合作商授权来获得用户的社交和网络行为特征数据,且上述数据的准确度和实时性难以保障。同时,运营商自身的业务数据却没有得以充分利用。因此,如何充分利用运营商自身数据对用户进行分类,成为本领域亟待解决的问题。
发明内容
为此,本申请提供一种分类方法及装置,以解决在对用户进行分类时,从异业合作商获取的数据其准确度和实时性无法保障,同时运营商自身数据没有得以充分利用的问题。
为了实现上述目的,本申请第一方面提供一种分类方法,该分类方法包括:
基于用户的通信消费数据和预设特征维度构建一级特征向量;
依据一级特征向量和预设特征阈值,获得二级特征向量;
对二级特征向量进行标准化处理,获得标准化特征向量;
基于因子分解机模型和标准化特征向量,获得组合特征向量;
对多个用户的组合特征向量进行聚类处理,获得用户分类。
进一步地,预设特征维度包括业务使用量、业务使用时段、套餐消费和增值消费中的任意一种或多种。
进一步地,标准化处理包括独热编码处理和/或归一化处理。
进一步地,二级特征向量包括数值类二级特征向量和字符串类二级特征向量;
对二级特征向量进行标准化处理,获得标准化特征向量,包括:
对数值类二级特征向量进行归一化处理,获得与数值类二级特征向量对应的标准化特征向量;
对字符串类二级特征向量进行独热编码处理,获得与字符串类二级特征向量对应的标准化特征向量。
进一步地,基于因子分解机模型和标准化特征向量,获得组合特征向量,包括:
将标准化特征向量输入因子分解机模型,获得输出结果;其中,输出结果包括组合特征向量。
进一步地,对多个用户的组合特征向量进行聚类处理,获得用户分类,包括:
基于组合特征向量,构建组合特征矩阵;
基于预设的随机函数、预设聚类数和组合特征矩阵,构建初始隶属度矩阵;
基于初始隶属度矩阵和组合特征矩阵计算类中心矩阵;
基于类中心矩阵更新初始隶属度矩阵,获得更新的隶属度矩阵;
根据隶属度矩阵判断是否满足预设的停止条件;
在满足停止条件的情况下,根据当前隶属度矩阵获得用户分类;
在不满足停止条件的情况下,执行隶属度矩阵的迭代操作直至满足停止条件,并根据当前隶属度矩阵获得用户分类。
进一步地,执行隶属度矩阵的更新操作,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011399123.9/2.html,转载请声明来源钻瓜专利网。