[发明专利]用户类别识别方法、装置、电子设备及存储介质在审
申请号: | 201910860278.9 | 申请日: | 2019-09-11 |
公开(公告)号: | CN112488138A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 赵俊;王丹弘;李启文;刘钢庭 | 申请(专利权)人: | 中国移动通信集团广东有限公司;中国移动通信集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04M1/663 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 510623 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 类别 识别 方法 装置 电子设备 存储 介质 | ||
1.一种用户类别识别方法,其特征在于,包括:
对采集到的用户通信数据进行预处理,得到数据样本集;
根据与所述数据样本集对应的距离分布矩阵中的数据点距离分布情况,确定出扫描半径和最小包含点数;
根据所述扫描半径和所述最小包含点数,对所述数据样本集进行分簇,得到目标簇;
根据用户行为特征和所述目标簇确定出用户的类别。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述目标簇进行聚类分析;
所述根据用户行为特征和所述目标簇确定出用户的类别,包括:
根据所述聚类分析的结果和所述用户行为特征确定出用户的类别。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标簇进行聚类分析,包括:
通过谱聚类算法对所述目标簇进行聚类分析。
4.根据权利要求1所述的方法,其特征在于,所述对采集到的用户通信数据进行预处理,包括:
对采集到的同一基站的用户通信数据进行异常值剔除、空值处理、去重、聚合统计以及归一化处理。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述用户行为特征对归一化处理后得到的数据进行数据特征扩展,得到所述得到数据样本集。
6.根据权利要求1所述的方法,其特征在于,所述根据与所述数据样本集对应的距离分布矩阵中的数据点距离分布情况,确定出扫描半径和最小包含点数,包括:
根据所述数据样本集计算出对应的所述距离分布矩阵;
对所述距离分布矩阵中的每行数据以及所述所述距离分布矩阵中的每列数据进行升序排列或降序排列,得到数据点距离分布图;
根据所述数据点距离分布图中的数据点距离的密集分布程度,确定出所述扫描半径;
根据所述扫描半径确定出所述距离分布矩阵中的数据的邻域的对象数量;
计算所述对象数量的数学期望值,得到所述最小包含点数。
7.根据权利要求1所述的方法,其特征在于,所述对所述数据样本集进行分簇,包括:
通过基于密度的聚类算法对所述数据样本集进行分簇。
8.一种用户类别识别装置,其特征在于,所述用户类别识别装置包括:
预处理模块,用于对采集到的用户通信数据进行预处理,得到数据样本集;
第一确定模块,用于根据与所述数据样本集对应的距离分布矩阵中的数据点距离分布情况,确定出扫描半径和最小包含点数;
分簇模块,用于根据所述扫描半径和所述最小包含点数,对所述数据样本集进行分簇,得到目标簇;
第二确定模块,用于根据用户行为特征和所述目标簇确定出用户的类别。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序,实现权利要求1至7任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司;中国移动通信集团有限公司,未经中国移动通信集团广东有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860278.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种控制镀锡板表面取走辊辊印的方法
- 下一篇:一种设备的仿真测试方法和装置