[发明专利]重入网用户的识别方法、装置及设备有效
申请号: | 202010350086.6 | 申请日: | 2020-04-28 |
公开(公告)号: | CN113573242B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 蔡国庆 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | H04W4/029 | 分类号: | H04W4/029;H04W8/26;H04W24/08;H04B17/318 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;曹娜 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 入网 用户 识别 方法 装置 设备 | ||
本发明提供了一种重入网用户的识别方法、装置及设备。该方法包括:获取至少两个用户的行为特征向量;行为特征向量中记录了目标行为的发生时间、空间位置和强度表示信息;根据每一用户的行为特征向量在时空行为特征立方体中确定的特征点,对第一用户的特征点与第二用户的特征点进行相似度分析,判断第二用户是否为第一用户的重入网用户;其中时空行为特征立方体以时间、空间位置的经度和空间位置的纬度为坐标,特征点依据目标行为的时间和空间位置在时空行为特征立方体中分布。该识别方法利用时间、空间位置和强度表示信息构建用户的行为特征向量,将不同用户的特征点进行比较,能够简单、有效地识别出同一运营网络中的重入网用户。
技术领域
本发明涉及通信技术领域,尤其是指一种重入网用户的识别方法、装置及设备。
背景技术
正在或者曾经使用某家运营商卡号的用户,在短期内又购买所属同一运营商的卡号入网,新号码全部或部分替代旧号码,这部分用户即为重入网用户,重入网用户占用系统卡号资源,增加了公司的营销成本,加大业务风险,因此需要进行有效识别并管理。但是由于重入网手机号码和原在网手机号码是两个不同的号码,因此如何判断这两个号码是否属于同一人使用是识别重入网号码的关键。
发明内容
本发明技术方案的目的在于提供一种重入网用户的识别方法、装置及设备,能够简单、有效地识别出同一运营网络中的重入网用户。
本发明实施例提供一种重入网用户的识别方法,其中,包括:
获取至少两个用户的行为特征向量;所述行为特征向量中记录了目标行为的发生时间、空间位置和强度表示信息;
根据每一用户的所述行为特征向量在时空行为特征立方体中确定的特征点,对至少两个用户中第一用户的特征点与第二用户的特征点进行相似度分析,判断所述第二用户是否为所述第一用户的重入网用户;
其中所述时空行为特征立方体以时间、空间位置的经度和空间位置的纬度为坐标,所述行为特征向量所对应的特征点依据目标行为的时间和空间位置在所述时空行为特征立方体中分布。
可选地,所述的重入网用户的识别方法,其中,所述获取至少两个用户的行为特征向量,包括:
采集每一用户的行为数据;所述行为数据包括不同目标行为的时间、空间位置和强度表示信息;
根据所述行为数据构造每一用户的所述时空行为特征立方体;
对所述时空行为特征立方体中的行为数据进行聚类分析,确定强度表示信息大于预设强度阈值的相对应行为数据为所述行为特征向量;
删除所述时空行为特征立方体中所述行为特征向量相对应特征点之外的其他特征点。
可选地,所述的重入网用户的识别方法,其中,所述对所述时空行为特征立方体中的行为数据进行聚类分析,确定强度表示信息大于预设强度阈值的相对应行为数据为所述行为特征向量,包括:
依据时间维度对所述时空行为特征立方体进行切片,形成多个切片数据;
对每一切片数据内的行为数据进行聚类,确定至少一聚类点;
将每一聚类点相对应行为数据的强度表示信息与预设强度阈值进行比较,确定强度表示信息大于预设强度阈值的相对应行为数据为所述行为特征向量。
可选地,所述的重入网用户的识别方法,其中,所述强度表示信息表示为预设统计周期内目标行为的累计时长。
可选地,所述的重入网用户的识别方法,其中,在对至少两个用户中第一用户的特征点与第二用户的特征点进行相似度分析之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010350086.6/2.html,转载请声明来源钻瓜专利网。