[发明专利]一种识别群组中用户的方法、装置及电子设备在审
申请号: | 202010694009.2 | 申请日: | 2020-07-17 |
公开(公告)号: | CN113946720A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 张湛梅;谭丽丽;张晓川 | 申请(专利权)人: | 中国移动通信集团广东有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/906;G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
地址: | 510623 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 群组中 用户 方法 装置 电子设备 | ||
本发明实施例提供了一种识别群组中用户的方法、装置及电子设备,包括:获取待识别的通信号码信息;从通信号码信息中提取出与通信号码相关联的特征信息,并将特征信息输入预先构建的随机森林识别模型,然后,通过随机森林识别模型识别通信号码信息对应的用户是否属于预设群组中的用户,其中,随机森林识别模型是根据CART算法生成的决策树生成的,在根据CART算法生成决策树的过程中,所采用的基尼系数为添加了目标特征信息的惩罚项的基尼系数,其中,目标特征信息包括:用户身份属性信息、终端标识信息、基站信息、地理位置信息中的一个或多个。通过本发明实施例,提高了对预设群组中的用户的识别效率且识别过程占用系统资源低、识别准确度高。
技术领域
本发明涉及移动通信技术领域,尤其涉及一种识别群组中用户的方法、装置及电子设备。
背景技术
目前,随着移动通信技术的快速发展,移动终端(如智能手机等)已成为人们日常生活中必不可少的电子消费品,人们经常在各种场合各种地点使用智能手机,而用户在使用智能手机的过程中对数据流量的需求也日益增多。为了实现精准营销的目的,运营商们往往需要对用户的通信号码进行识别。现有的识别方法,往往采用的是建立预设通信行为数据库,然后将待识别用户的通讯行为数据与该数据库中的数据进行匹配,根据匹配程度来确定上述待识别的用户是否属于预设群组。
然而,上述方法中由于在进行数据匹配的过程中需要对数据库中的全部数据进行遍历,较为耗时且占用较多的系统资源,此外,根据用户之间的通信行为数据来确定用户是否属于预设群组(如某集团)的方法,受通信特征相似的通信号码影响干扰较大,导致识别结果的准确性较低。
发明内容
本发明实施例的目的是提供一种识别群组中用户的方法、装置及电子设备,以解决相关技术中识别过程较为耗时、占用较多的系统资源且识别准确度低的技术问题。
为了解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供了一种识别群组中用户的方法,包括:
获取待识别的通信号码信息;
从所述通信号码信息中提取出与所述通信号码相关联的特征信息,其中,所述特征信息包括以下中的一项或多项:用户身份属性信息、终端标识信息、基站信息、地理位置信息;
将所述特征信息输入预先构建的随机森林识别模型,通过所述随机森林识别模型识别所述通信号码信息对应的用户是否属于预设群组中的用户;
其中,所述随机森林识别模型是根据CART算法生成的决策树生成的,在根据所述CART算法生成决策树的过程中,所采用的基尼系数为添加了目标特征信息的惩罚项的基尼系数,其中,所述目标特征信息包括:用户身份属性信息、终端标识信息、基站信息、地理位置信息中的一个或多个。
可选地,所述方法还包括:
获取第一特征信息集,所述第一特征信息集包括与多个通信号码相关联的特征信息,所述特征信息包括以下中的一项或多项:用户身份属性信息、终端标识信息、基站信息、地理位置信息;
对所述第一特征信息集中的特征信息进行可放回抽样,得到多个第二特征信息集;
计算所述第二特征信息集中各特征信息的基尼系数,其中,所述基尼系数为添加了目标特征信息的惩罚项的基尼系数,其中,所述目标特征信息包括:用户身份属性信息、终端标识信息、基站信息、地理位置信息中的一个或多个;
根据所述基尼系数,采用CART算法生成决策树;
根据所述决策树,生成随机森林识别模型。
可选地,在所述获取第一特征信息集之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司;中国移动通信集团有限公司,未经中国移动通信集团广东有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010694009.2/2.html,转载请声明来源钻瓜专利网。