[发明专利]一种黑产识别方法、装置及计算机可读存储介质在审
申请号: | 202211057313.1 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115426167A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 王智明;徐雷;陶冶 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06N20/00 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 邓伯英;罗建民 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种黑产识别方法,其特征在于,包括:
获取终端发送的黑产识别请求,所述黑产识别请求携带IP地址和互联网流量数据;
采用基于人工智能AI自主学习规则的互联网黑产识别模型对所述IP地址和互联网流量数据进行分析,得到所述IP地址和互联网流量数据是否为黑产的识别结果;
将所述识别结果返回给终端。
2.根据权利要求1所述的方法,其特征在于,所述获取终端发送的黑产识别请求之前,所述方法还包括:
获取一个或多个威胁情报中黑产数据对应的种子数据;
利用所述种子数据验证所述互联网黑产识别模型识别的准确率和覆盖率;
若所述互联网黑产识别模型识别的准确率或覆盖率不满足预设的阈值,则采用所述种子数据对所述互联网黑产识别模型进行迭代优化训练。
3.根据权利要求1所述的方法,其特征在于,所述采用基于人工智能AI自主学习规则的互联网黑产识别模型对所述IP地址和互联网流量数据进行分析,得到所述IP地址和互联网流量数据是否为黑产的识别结果,具体包括:
S1:设置迭代初始参数和最大迭代次数;
S2:基于识别准确率和识别覆盖率对所述IP地址和互联网流量数据进行分析,并基于最大估计得到匹配度最优的互联网黑产识别方案;
S3:判断所述匹配度最优的互联网黑产识别方案是否满足预设的评估条件,如果满足,则转到步骤S6;如果不满足,则转到步骤S4;
S4:对所述识别准确率和识别覆盖率进行深度半监督学习;
S5:将迭代次数加1,并判断当前迭代次数是否小于所述最大迭代次数,若是,返回执行步骤S2,若否,则执行步骤S6;
S6:将所述匹配度最优的互联网黑产识别方案作为最终的互联网黑产识别方案,得到所述IP地址和互联网流量数据是否为黑产的识别结果。
4.根据权利要求3所述的方法,其特征在于,所述基于识别准确率和识别覆盖率对所述IP地址和互联网流量数据进行分析,并基于最大估计得到匹配度最优的互联网黑产识别方案中,所述最大估计根据以下计算公式得到:
式中,k为迭代次数,i、j和t为维度;m、n和p分别为i、j和t的最大维度值,为第k次迭代时的最大估计,为第k次迭代时的识别覆盖率,CGmax为历史最大黑产识别覆盖率,为第k次迭代时的识别准确率,WGmin为历史最大黑产识别准确率。
5.根据权利要求3所述的方法,其特征在于,所述判断所述匹配度最优的互联网黑产识别方案是否满足预设的评估条件,具体根据以下公式进行判断:
式中,k为迭代次数,i、j和t为维度,m、n和p分别为i、j和t的最大维度值;为第k次迭代时的识别覆盖率,为第k次迭代时的识别准确率,P为概率,为第k次迭代时的最大估计,为第0次迭代时的最大估计。
6.根据权利要求5所述的方法,其特征在于,所述对所述识别准确率和识别覆盖率进行深度半监督学习,具体根据以下公式进行深度半监督学习:
式中,主要包含三方面的信息向量,为第k+1次迭代时的识别覆盖率,κ为调整系数,为第k+1次迭代时的识别准确率,Bijtk+1为第k+1次迭代时的深度半监督学习因子;
其中,深度半监督学习因子Bijtk+1根据以下公式得到:
式中,CGmax为历史最大黑产识别覆盖率,WGmin为历史最大黑产识别准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211057313.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种应用于微纳卫星的集成化星载计算机系统
- 下一篇:一种身份认证方法及装置