[发明专利]用户行为分类审计方法、装置、设备及计算机存储介质在审
申请号: | 202011491365.0 | 申请日: | 2020-12-16 |
公开(公告)号: | CN114637826A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 曹继文;杨宇婷;敖锦蓉;徐海勇;刘虹;陶涛;尚晶;林海艺 | 申请(专利权)人: | 中移动信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 赵秀芹 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 行为 分类 审计 方法 装置 设备 计算机 存储 介质 | ||
本申请提供了一种用户行为分类审计方法、装置、设备及计算机存储介质。该用户行为分类审计方法,包括:采集用户行为信息;在确定用户行为信息中存在预设的关键字的情况下,利用预设的决策树分类模型对用户行为信息进行分类,确定用户行为信息的类别;其中,决策树分类模型是利用K折交叉验证及改进的梯度提升决策树算法进行模型训练得到的;获取用户行为信息的类别对应的审计日志。根据本申请实施例,能够提高用户行为分类审计的准确率。
技术领域
本申请属于用户行为分类审计技术领域,尤其涉及一种用户行为分类审计方法、装置、设备及计算机存储介质。
背景技术
通过对从各大数据平台组件采集到的原始日志进行解析、字段标准化映射、以及日志的操作类型和操作细项划分处理,可以实现来源、格式不一的大数据平台中各组件的初始日志进行标准化;然后,根据大数据安全管控的审计要求,采用相应的审计规则和分析策略,对大数据平台中各组件的标准化后的日志进行自动化审计分析,来确定大数据平台及组件的管理和数据访问操作是否符合安全技术规范和管理要求。
现有技术先对日志先做标准化处,然后根据审计规则构建算法模型,指定算法参数,训练模型,进行分析匹配。算法复杂且缺少灵活性,而单纯的使用多分类节点的决策树进行分类无法满足对于用户行为中出现用户灵活性操作的分类需求,审计准确率低。
因此,如何提高用户行为分类审计的准确率是本领域技术人员亟需解决的技术问题。
发明内容
本申请实施例提供一种用户行为分类审计方法、装置、设备及计算机存储介质,能够提高用户行为分类审计的准确率。
第一方面,本申请实施例提供一种用户行为分类审计方法,包括:
采集用户行为信息;
在确定用户行为信息中存在预设的关键字的情况下,利用预设的决策树分类模型对用户行为信息进行分类,确定用户行为信息的类别;其中,决策树分类模型是利用K折交叉验证及改进的梯度提升决策树算法进行模型训练得到的;
获取用户行为信息的类别对应的审计日志。
可选的,关键字包括操作时间、操作IP、操作用户、操作指令及指令参数。
可选的,在确定用户行为信息中存在预设的关键字的情况下,利用预设的决策树分类模型对用户行为信息进行分类,确定用户行为信息的类别之前,方法还包括:
获取审计集;
基于审计集中的训练集,利用K折交叉验证及改进的梯度提升决策树算法进行模型训练,得到决策树分类模型。
可选的,在基于审计集中的训练集,利用K折交叉验证及改进的梯度提升决策树算法进行模型训练,得到决策树分类模型之后,方法还包括:
利用审计集中的测试集,对决策树分类模型进行测试。
第二方面,本申请实施例提供了一种用户行为分类审计装置,包括:
采集模块,用于采集用户行为信息;
分类模块,用于在确定用户行为信息中存在预设的关键字的情况下,利用预设的决策树分类模型对用户行为信息进行分类,确定用户行为信息的类别;其中,决策树分类模型是利用K折交叉验证及改进的梯度提升决策树算法进行模型训练得到的;
第一获取模块,用于获取用户行为信息的类别对应的审计日志。
可选的,关键字包括操作时间、操作IP、操作用户、操作指令及指令参数。
可选的,装置还包括:
第二获取模块,用于获取审计集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移动信息技术有限公司;中国移动通信集团有限公司,未经中移动信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011491365.0/2.html,转载请声明来源钻瓜专利网。