[发明专利]一种识别群组中用户的方法、装置及电子设备在审
申请号: | 202010694009.2 | 申请日: | 2020-07-17 |
公开(公告)号: | CN113946720A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 张湛梅;谭丽丽;张晓川 | 申请(专利权)人: | 中国移动通信集团广东有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/906;G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
地址: | 510623 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 群组中 用户 方法 装置 电子设备 | ||
1.一种识别群组中用户的方法,其特征在于,所述方法包括:
获取待识别的通信号码信息;
从所述通信号码信息中提取出与所述通信号码相关联的特征信息,其中,所述特征信息包括以下中的一项或多项:用户身份属性信息、终端标识信息、基站信息、地理位置信息;
将所述特征信息输入预先构建的随机森林识别模型,通过所述随机森林识别模型识别所述通信号码信息对应的用户是否属于预设群组中的用户;
其中,所述随机森林识别模型是根据CART算法生成的决策树生成的,在根据所述CART算法生成决策树的过程中,所采用的基尼系数为添加了目标特征信息的惩罚项的基尼系数,其中,所述目标特征信息包括:用户身份属性信息、终端标识信息、基站信息、地理位置信息中的一个或多个。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一特征信息集,所述第一特征信息集包括与多个通信号码相关联的特征信息,所述特征信息包括以下中的一项或多项:用户身份属性信息、终端标识信息、基站信息、地理位置信息;
对所述第一特征信息集中的特征信息进行可放回抽样,得到多个第二特征信息集;
计算所述第二特征信息集中各特征信息的基尼系数,其中,所述基尼系数为添加了目标特征信息的惩罚项的基尼系数,其中,所述目标特征信息包括:用户身份属性信息、终端标识信息、基站信息、地理位置信息中的一个或多个;
根据所述基尼系数,采用CART算法生成决策树;
根据所述决策树,生成随机森林识别模型。
3.根据权利要求2所述的方法,其特征在于,在所述获取第一特征信息集之后,所述方法还包括:
对所述第一特征信息集中的特征信息进行筛选,将任意两个不同特征信息之间的相关系数大于第一预设阈值,且所述不同特征信息中重要度低的特征信息进行筛除,得到筛选后的第一特征信息集。
4.根据权利要求3所述的方法,其特征在于,所述对所述第一特征信息集中的特征信息进行筛选,将任意两个不同特征信息之间的相关系数大于第一预设阈值,且所述不同特征信息中重要度低的特征信息进行筛除,得到筛选后的第一特征信息集,包括:
采用相关分析法计算所述第一特征信息集中任意两个不同特征信息之间的相关系数;
采用递归特征消除法确定各特征信息的重要性;
针对所述特征信息,将任意两个不同特征信息之间的相关系数大于第一预设阈值,且所述不同特征信息中重要度低的特征信息进行筛除,得到筛选后的第一特征信息集。
5.根据权利要求4所述的方法,其特征在于,所述采用相关分析法计算所述第一特征信息集中两两特征信息之间的相关系数,包括:
采用斯皮尔曼等级相关系数方法计算所述第一特征信息集中任意两个不同特征信息之间的相关系数。
6.根据权利要求4所述的方法,其特征在于,所述采用递归特征消除法确定各特征信息的重要性,包括:
将所述第一特征信息集中的任意两个不同特征信息进行组合;
将组合后的任意两个不同特征信息输入至SVM二分类模型中,得到特征信息的组合分值;
根据包含所述特征信息的多个所述组合分值,计算所述特征信息的重要性分值。
7.一种识别群组中用户的装置,其特征在于,所述装置包括:
第一获取模块,用于获取待识别的通信号码信息;
提取模块,用于从所述通信号码信息中提取出与所述通信号码相关联的特征信息,其中,所述特征信息包括以下中的一项或多项:用户身份属性信息、终端标识信息、基站信息、地理位置信息;
识别模块,用于将所述特征信息输入预先构建的随机森林识别模型,通过所述随机森林识别模型识别所述通信号码信息对应的用户是否属于预设群组中的用户;
其中,所述随机森林识别模型是根据CART算法生成的决策树生成的,在根据所述CART算法生成决策树的过程中,所采用的基尼系数为添加了目标特征信息的惩罚项的基尼系数,其中,所述目标特征信息包括:用户身份属性信息、终端标识信息、基站信息、地理位置信息中的一个或多个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司;中国移动通信集团有限公司,未经中国移动通信集团广东有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010694009.2/1.html,转载请声明来源钻瓜专利网。