[发明专利]用户聚类方法、装置、设备和介质在审
申请号: | 201811612655.9 | 申请日: | 2018-12-27 |
公开(公告)号: | CN111382754A | 公开(公告)日: | 2020-07-07 |
发明(设计)人: | 周全;梁志;杨波 | 申请(专利权)人: | 中国移动通信集团山西有限公司;中国移动通信集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 030032 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 方法 装置 设备 介质 | ||
本发明公开了用户聚类方法、装置、设备和介质。该方法包括:获取指定历史时间段内多个待聚类用户的业务数据;针对每个待聚类用户,构建该待聚类用户的业务数据的时间序列,并根据业务时间序列计算该待聚类用户的赫斯特指数;根据多个待聚类用户的赫斯特指数,对多个待聚类用户进行聚类,得到多个用户簇。根据本发明实施例提供的方案,可以提高用户聚类的精准度。
技术领域
本发明涉及通信领域,尤其涉及用户聚类方法、装置、设备和介质。
背景技术
随着通信技术的发展,通信网络中包含着海量数据。相应地,大数据分析逐渐成为近年来通信运营商关注的热门话题。
为了实现对用户的精准化管理,需要对用户进行聚类。然后,用户的需求往往是多维度的。如何依据用户的需求,将庞大的用户群体进行精准聚类,成为通信运营商关注的焦点。
现有技术中,通常使用人工手段对用户群体进行聚类,精准度不高。
发明内容
本发明实施例提供用户聚类方法、装置、设备和介质,可以提高用户聚类的精准度。
根据本发明实施例的一方面,提供一种用户聚类方法,包括:
获取指定历史时间段内多个待聚类用户的业务数据;
针对每个待聚类用户,构建该待聚类用户的业务数据的时间序列,并根据业务时间序列计算该待聚类用户的赫斯特指数;
根据所述多个待聚类用户的赫斯特指数,对所述多个待聚类用户进行聚类,得到多个用户簇。
其中,每个用户簇中待聚类用户的赫斯特指数与该用户簇的基准赫斯特指数的差值小于等于预设的指数阈值。
在一种可选的实施方式中,业务数据包括以下一种或多种:
办理的语音业务数据、办理的流量业务数据、办理的交互式网络电视IPTV业务数据和办理的增值业务数据。
在一种可选的实施方式中,每个待聚类用户的业务数据的时间序列包括:按照时间先后顺序排列的、由指定历史时间段划分的多个子时间段内的业务数据;多个子时间段内的业务数据符合正态分布。
在一种可选的实施方式中,根据业务时间序列计算该待聚类用户的赫斯特指数,具体包括:
针对每个待聚类用户,基于该待聚类用户的业务数据的时间序列的正态分布,业务数据的时间序列的协方差矩阵;
基于所述协方差矩阵和所述待聚类用户的业务数据的时间序列的极差,计算所述待聚类用户的赫斯特指数。
在一种可选的实施方式中,待聚类用户的业务数据的时间序列的极差表示业务数据的时间序列的累计离差中的最大值和最小值的差值。
在一种可选的实施方式中,方法还包括:
基于指定历史时间段内多个用户的业务数据,计算每个用户的李雅普诺夫指数;
将李雅普诺夫指数小于等于零的用户作为待聚类用户。
在一种可选的实施方式中,每个用户簇的基准赫斯特指数可以是通信运营商提供的通信套餐的赫斯特指数。
根据本发明实施例的另一方面,提供一种用户聚类装置,包括:
获取处理模块,用于获取指定历史时间段内多个待聚类用户的业务数据;
第一计算模块,用于针对每个待聚类用户,构建该待聚类用户的业务数据的时间序列,并根据业务时间序列计算该待聚类用户的赫斯特指数;
聚类处理模块,用于根据所述多个待聚类用户的赫斯特指数,对所述多个待聚类用户进行聚类,得到多个用户簇,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团山西有限公司;中国移动通信集团有限公司,未经中国移动通信集团山西有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811612655.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:封隔器
- 下一篇:一种改善等离子体刻蚀均匀性的装置及方法