[发明专利]一种少数类用户网络访问特征的选取方法有效
申请号: | 201610394392.3 | 申请日: | 2016-06-03 |
公开(公告)号: | CN105956187B | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 牟超;周庆;胡月;孙启亮;孟瑶;全文君;廖凤露;尹春梅 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 蔡智 |
地址: | 400045 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种少数类用户网络访问特征的选取方法,涉及大数据分析领域,包括如下步骤:首先,从网关服务器下载日志,统计真实用户的网络访问数据,并组成初始数据集;其次,创建N名少数类的虚拟用户,构建虚拟数据集;再次,对虚拟数据集进行相关性分析,选取出与少数类用户显著相关的访问特征;最后,进行因子分析,进一步降低特征维数。本发明通过创建虚拟用户,自动平衡少数类用户的比例,使得在目标用户人数占比很小时,依然可以提取的网络访问特征。 | ||
搜索关键词: | 一种 少数 用户 网络 访问 特征 选取 方法 | ||
【主权项】:
1.一种少数类用户网络访问特征的选取方法,其特征在于,包括如下步骤:步骤一、从网关服务器下载日志,统计真实用户的网络访问数据,并组成初始数据集;其中,所述初始数据集的维数是m×d,m是总人数,d是特征数目,所述初始数据集的数据包含有符合指数分布的数据;步骤二、创建N名少数类的虚拟用户,构建虚拟数据集;其中,所述虚拟数据集的维度为(m+N)×d,所述虚拟数据集与初始数据集的数据满足概率同分布;A0、标记所述少数类用户Si,其中i∈[1,p],p是所述少数类用户的总人数;所述步骤二具体包括:A1、计算每个特征的均值μj,j∈[1,d],A2、计算需要创建的所述虚拟少数类用户的总人数:N=m‑p,A3、判断p是否大于1,如果是,则继续执行A4,否则直接复制N名S1并执行步骤三,A4、计算每名真实少数类用户需对应虚拟的人数
A5、按照指数分布对Si增加n名所述虚拟用户;步骤三、对虚拟数据集进行相关性分析,选取出与少数类用户显著相关的访问特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610394392.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种新型吸尘器
- 下一篇:一种移动式络筒机加湿除尘装置