[发明专利]养卡用户识别方法及装置有效
申请号: | 202010470197.0 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111626754B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 周雪;张少华;冯家刚;孟琳琳;赵锡成;李娜 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06Q30/018 | 分类号: | G06Q30/018;G06Q30/0207;G06F18/23 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 李阳;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 识别 方法 装置 | ||
本发明实施例提供一种养卡用户识别方法及装置,该方法包括获取样本用户的用户数据,筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户以及根据所有正常用户的用户社交数据确定初始正常用户,并将目标用户的用户社交数据作为目标数据,对初始疑似养卡用户和初始正常用户的用户社交数据及目标数据确定为样本数据进行聚类识别养卡用户。通过利用用户的社交数据难以伪造的特性,采用用户社交数据设置聚类算法的初始点,对目标样本的社交数据进行分析,提高了识别养卡用户结果的准确性。
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种养卡用户识别方法及装置。
背景技术
在通信运营商和代理商的合作过程中,一些代理商为了获得更高的报酬,往往通过批量开通虚拟账户的作弊手段提升销售业绩,这种行为被称为养卡。大量的养卡用户会造成运营商客户虚增,出现运营、活动成本提高但是运营商的业务收入却在下降的情况,导致运营商的直接经济损失。因此,需要准确地识别出养卡用户并及时进行处理。
目前,一般采用对已确认养卡用户的通信数据进行分析,发现养卡用户的数据特征,例如养卡用户的主叫分钟和被叫分钟远低于正常通信分钟数,或者短信次数和上网流量少等通信数据特征。通过对养卡用户的数据特征进行分析以及构建识别养卡用户的判断模型,并根据该判断模型对全网数据进行分析,挖掘异常用户行为,确定疑似养卡用户名单。
然而,现有养卡用户通过将一批手机卡插入到一个养卡器中,并通过设置国际移动设备识别码(International Mobile Equipment Identity,简称IMEI)日常通信活动,伪造正常的用户行为数据,导致判断模型不能进行有效识别养卡用户,依然存在养卡用户识别不准确和误判的问题。
发明内容
本发明实施例提供一种养卡用户识别方法及装置,以提高养卡用户的识别结果的准确性。
第一方面,本发明实施例提供一种养卡用户识别方法,包括:
获取样本用户的用户数据,并根据第一预设条件筛选所述样本用户的用户数据获得疑似养卡用户集合及正常用户集合;
获取所述疑似养卡用户集合中的每个疑似养卡用户的用户社交数据,并根据所有疑似养卡用户的用户社交数据确定初始养卡用户,其中所述初始养卡用户的用户社交数据中每一项属性数据分别与其他所有疑似养卡用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;
获取所述正常用户集合中的每个正常用户的用户社交数据,并根据所有正常用户的用户社交数据确定初始正常用户,其中所述正常用户的用户社交数据中每一项属性数据分别与其他所有正常用户的用户社交数据中每一项属性数据的欧氏距离的总合最小;
获取所有目标用户的用户社交数据作为目标数据,将初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户;
将所述养卡用户的信息发送至运营商监管平台。
在一种可能的设计中,所述获取所有目标用户的用户社交数据作为目标数据,将所述初始疑似养卡用户和所述初始正常用户的用户社交数据及所述目标数据确定为样本数据,对所述样本数据进行聚类识别养卡用户,包括:
将所述初始疑似养卡用户的用户社交数据以及所述初始正常用户的用户社交数据分别作为聚类算法的第一中心点和第二中心点;
分别获取每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有属性数据的欧氏距离,并根据每个目标用户与所述第一中心点和所述第二中心点之间用户社交数据中所有属性数据的欧氏距离确定目标养卡用户集合,所述目标养卡用户集合中每个目标养卡用户与所述第一中心点之间的欧氏距离小于所述目标养卡用户与所述第二中心点之间的欧氏距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010470197.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:时间敏感网络中的资源分配方法
- 下一篇:一种颈部转动识别方法及系统