[发明专利]邮件账号异常检测方法、装置及存储介质有效
申请号: | 202010578662.2 | 申请日: | 2020-06-23 |
公开(公告)号: | CN113839852B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 龙春;张宇柔;杜冠瑶;赵静;杨帆 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | H04L51/23 | 分类号: | H04L51/23;H04L51/212;H04L51/42;G06F16/906;G06F18/23;G06N20/00 |
代理公司: | 北京知舟专利事务所(普通合伙) 11550 | 代理人: | 郭韫 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 邮件 账号 异常 检测 方法 装置 存储 介质 | ||
1.一种邮件账号异常检测方法,其特征在于,包括:
对邮件账号日志进行预处理;
基于聚类技术对预处理后的邮件账号日志进行解析,生成消息模式集合,所述消息模式集合用于表征用户行为;
对所述消息模式集合进行账号信息提取,并输入机器学习模型进行训练,得到异常检测模型;其中,所述异常检测模型包括账号异常检测模型和/或IP异常检测模型;
将当前账号的邮件账号日志输入所述异常检测模型,预测所述邮件账号日志是否存在异常;
所述对邮件账号日志进行预处理,包括:对所述邮件账号日志包括的系统消息进行过滤处理,保留所述邮件账号日志中的IP消息及账号消息,对过滤处理后的日志中的共性特征进行通配符替换处理;
所述基于聚类技术对预处理后的邮件账号日志进行解析,生成消息模式集合,所述消息模式集合用于表征用户行为,包括:计算预处理后的邮件账号日志中的相应信息与通配符之间的相似度;将相似度大于或等于预设阈值的日志进行归类处理;将归类后得到的多个类作为所述消息模式集合。
2.根据权利要求1所述的邮件账号异常检测方法,其特征在于,所述计算预处理后的邮件账号日志中的相应信息与通配符之间的相似度,包括:
计算预处理后的邮件账号日志中的相应信息与通配符之间的距离,所述距离为余弦距离或欧式距离;
所述方法还包括:
对所述消息模式集合中的至少一个类添加标识,所述标识包括黑名单标识或白名单标识。
3.根据权利要求1所述的邮件账号异常检测方法,其特征在于,所述对所述消息模式集合进行账号信息提取,并输入机器学习模型进行训练,得到异常检测模型,包括:
对所述消息模式集合中预设时间段内的IP消息和账号消息进行事件统计,得到计数矩阵;
将所述计数矩阵输入机器学习模型,进行非监督训练或半监督训练;
将训练得到的模型作为所述异常检测模型;其中,所述异常检测模型包括账号异常检测模型和/或IP异常检测模型。
4.一种邮件账号异常检测装置,其特征在于,包括:
预处理模块,用于对邮件账号日志进行预处理;
聚类模块,用于基于聚类技术对预处理后的邮件账号日志进行解析,生成消息模式集合,所述消息模式集合用于表征用户行为;
训练模块,用于对所述消息模式集合进行账号信息提取,并输入机器学习模型进行训练,得到异常检测模型;其中,所述异常检测模型包括账号异常检测模型和/或IP异常检测模型;
预测模块,用于将当前账号的邮件账号日志输入所述异常检测模型,预测所述邮件账号日志是否存在异常;
所述预处理模块,包括:
过滤子模块,用于对所述邮件账号日志包括的系统消息进行过滤处理,保留所述邮件账号日志中的IP消息及账号消息;
替换子模块,用于对过滤处理后的日志中的共性特征进行通配符替换处理;
所述聚类模块包括:
计算子模块,用于计算预处理后的邮件账号日志中的相应信息与通配符之间的相似度;
归类子模块,用于将相似度大于或等于预设阈值的日志进行归类处理,并将归类后得到的多个类作为所述消息模式集合。
5.根据权利要求4所述的邮件账号异常检测装置,其特征在于,
所述计算子模块,还用于计算预处理后的邮件账号日志中的相应信息与通配符之间的距离,所述距离为余弦距离或欧式距离;
所述聚类模块还包括:
标识子模块,用于对所述消息模式集合中的至少一个类添加标识,所述标识包括黑名单标识或白名单标识。
6.根据权利要求4所述的邮件账号异常检测装置,其特征在于,所述训练模块包括:
计数子模块,用于对所述消息模式集合中预设时间段内的IP消息和账号消息进行事件统计,得到计数矩阵;
训练子模块,用于将所述计数矩阵输入机器学习模型,进行非监督训练或半监督训练;并将训练得到的模型作为所述异常检测模型;其中,所述异常检测模型包括账号异常检测模型和/或IP异常检测模型。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1-3任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010578662.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种变风量实验室温度控制系统及方法
- 下一篇:一种用于涂塑钢管加工的喷涂装置