[发明专利]一种电商网络异常用户检测方法及系统有效
申请号: | 202110621861.1 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113409105B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 杜航原;李铎;王文剑 | 申请(专利权)人: | 山西大学 |
主分类号: | G06Q30/0601 | 分类号: | G06Q30/0601;G06Q30/012;G06N3/0455;G06N3/048;G06N3/084;G06F18/25 |
代理公司: | 太原申立德知识产权代理事务所(特殊普通合伙) 14115 | 代理人: | 郭海燕 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 异常 用户 检测 方法 系统 | ||
1.一种电商网络异常用户检测方法,其特征在于,包括以下步骤:
S10、对采集到的电商网络数据进行预处理;
S20、对步骤S10预处理后获得的电商网络数据进行空间结构信息的抽取,构建异质信息网络并转化为用户-设备二分图;
S30、基于步骤S20获得的用户-设备二分图,利用自编码器和支持向量数据描述构建电商网络异常用户检测模型;
S40、对于步骤S30构建的电商网络异常用户检测模型,通过迭代计算方式对模型进行训练,确定模型的最优参数,具体包括以下步骤:
S41、根据设备聚集性特性,用户之间的设备相似度使用式(9)计算:
其中,i,j∈[1,M],sim_dij为用户xi和xj之间的设备相似度,Ni表示用户xi登录过的设备的集合,Nj表示用户xj登录过的设备的集合;
根据活动聚集性特性将一天等分为24个时间段,统计每个用户在各个时间段内登录设备的次数Tp,p∈[0,23],并将每个用户的登录行为描述为ti=[T0,T1,...,T23],用户之间的活动相似度由式(10)计算:
其中,sim_tij为用户xi和xj之间的活动相似度,ti表示用户xi的登录行为,tj表示用户xj的登录行为;
根据式(9)、式(10),用户在原始空间中的行为相似度由式(11)计算:
simij=sim_dij×sim_tij (11)
其中,simij为用户xi和xj之间的行为相似度;
S42、用户低维表示之间的行为差异可以通过式(12)来计算:
其中,disij为用户低维表示zi和zj之间的欧式距离;
进一步的,用户低维表示之间的行为相似度由式(13)来计算:
其中,为用户低维表示zi和zj之间的行为相似度;
S43、为S30建立的电商网络异常用户检测模型建立式(14)所示的联合目标函数:
L=Lrec+α(Lsim+Lsvdd) (14)
其中α为超参数,取值范围在(0,1)内,Lrec为重构误差,用于度量原始输入S和重构输出之间的差异,由式(15)计算:
Lsim为行为相似度差异,用于度量两个用户间的行为相似度在编码前后的差异性,由式(16)计算:
Lsvdd为超球约束,作为区分正常用户和异常用户间的分类边界,由式(17)计算:
S44、对步骤S30中的电商网络异常用户检测模型进行初始化,初始化自编码器参数W和b,并给定超球隐空间维度dim、迭代次数epoch、批大小batch size和学习率learningrate;
迭代执行步骤S45-S49,直到达到设定的迭代次数,完成对电商网络异常用户检测模型的训练,获得模型的最优参数:
S45、将S22获取的用户-设备二分图结构S作为输入,按式(1)编码器编码获取用户低维表示集合Z;
S46、按式(3)解码器对用户低维表示集合Z进行解码得到完成正向传播;
S47、按式(11)计算用户之间的行为相似度,按式(13)计算用户低维表示之间的行为相似度;
S48、采用随机梯度下降法,通过优化式(14)中的联合目标函数L,完成反向传播,实现对自编码器中权重W和偏置b的更新;
S49、按步骤S33-S35,检测器对用户低维表示集合Z进行异常检测;
S50、利用步骤S30构建的电商网络异常检测模型,以及步骤S40确定的模型最优参数,将异常用户检测结果进行输出,并对异常用户进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110621861.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合消毒剂及其制备方法
- 下一篇:电子设备组件及终端设备