[发明专利]一种基于聚类分析的Web违规操作行为检测方法在审
申请号: | 202110639340.9 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113486366A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 魏力鹏;严彬元;陈卿;袁捷;吕嵘晶;王皓然;刘俊荣;陶佳冶;周泽元;班秋成;周琳妍;舒彧;冯光璐;纪元 | 申请(专利权)人: | 贵州电网有限责任公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/55;G06K9/62 |
代理公司: | 成都玖和知识产权代理事务所(普通合伙) 51238 | 代理人: | 胡琳梅 |
地址: | 550000 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 聚类分析 web 违规 操作 行为 检测 方法 | ||
1.一种基于聚类分析的Web违规操作行为检测方法,其特征在于,所述检测方法包括:
获取用户的当前操作行为数据;
提取所述当前操作行为数据中的操作特征信息集,根据操作特征信息集建立操作特征向量,确定所述操作特征向量与预设特征向量的操作行为匹配度;
将当前操作行为数据输入到聚类模型,得到当前操作行为是否违规的分析结果,若为违规则得到违规评价结果;
根据操作行为匹配度和违规评价结果,通过加权计算公式计算综合违规指数。
2.根据权利要求1所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,在所述获取用户的当前操作行为数据的步骤之前,所述检测方法还包括:
获取当前用户在终端设备的访问请求,所述访问请求包括用户登录信息;
根据用户登录信息确定与当前用户相对应的预设用户信息;
基于所述预设用户信息确定所述当前用户的访问权限,其中,所述访问权限包括允许访问和禁止访问。
3.根据权利要求2所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,所述根据用户登录信息确定与当前用户相对应的预设用户信息的步骤具体包括:
获取用户初次访问终端设备时注册信息,并将注册信息存储为预设用户信息,其中,所述预设用户信息包括用户ID和常用登录地址;
提取包含当前用户ID的登录信息,基于所述用户ID确定与所述登录信息对应的预设用户信息;
基于所述预设用户信息判断当前用户的登录地址是否与常用登录地址匹配,在当前用户的登录地址与常用登录地址匹配时,确定所述当前用户具有访问权限。
4.根据权利要求1所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,所述聚类模型的建立方法包括:
对所述计算样本数据进行层次聚类计算得到距离矩阵;
基于距离矩阵生成将多个样本数据进行聚类的聚类模型。
5.根据权利要求4所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,所述对所述计算样本数据进行层次聚类计算得到距离矩阵的步骤包括:
将每个所述样本数据设定为一个初始类簇;
计算每两个初始类簇之间的欧式距离;
所述欧式距离形成距离矩阵。
6.根据权利要求5所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,在所述根据操作特征信息建立操作特征向量的步骤之后,所述的检测方法还包括:
判断操作特征向量数据中的特征维度是否大于预设的维度阈值;
若所述特征项维度大于维度阈值,则对所述操作特征向量数据进行降维处理,所述降维处理为去除所述操作特征信息集中的特征项。
7.根据权利要求6所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,所述对所述操作特征向量数据进行降维处理的步骤包括:
根据预设的分析算法对所述操作特征信息集的各个特征项进行重新评估;
根据重新评估结果将所述操作特征向量数据中重要程度低的特征项从所述操作特征信息集中去除。
8.根据权利要求4-7任一所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,所述加权计算公式如下:
Community=a*matching_degree+(1-a)*IC_Value;
其中,a为权重系数,a的取值范围为[0,1],Community为违规指数,matching_degree为匹配度,IC_Value为评价结果。
9.根据权利要求5-7任一所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,所述样本数据的获取方式包括:
获取目标用户在网站上的历史操作行为数据,所述操作行为数据中包括2N个历史操作行为;
从所述历史操作行为中提取至少N个有效的样本操作行为,其中,N≥2;
对样本操作行为数据进行数据标准化预处理,得到样本数据。
10.根据权利要求9所述的基于一种聚类分析的Web违规操作行为检测方法,其特征在于,所述对样本操作行为数据进行数据标准化预处理,得到样本数据的步骤包括:
删除样本操作行为数据中数据缺失个数超过预设数量的数据;
对样本操作行为数据中的异常数据进行替换;
对样本操作行为数据进行标准化处理,得到样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110639340.9/1.html,转载请声明来源钻瓜专利网。