[发明专利]一种黑产场景下恶意云机器人的识别方法及系统有效
申请号: | 201910660771.6 | 申请日: | 2019-07-22 |
公开(公告)号: | CN110519228B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 石俊峥;刘梦严;郭煜 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N20/10 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 陈艳 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种黑产场景下恶意云机器人的识别方法及系统,以原始流量为对象进行分析,相比于Web服务器访问日志,最大程度上减少原始信息的损失,保留潜在的有用信息;同时,其多层流量统计特征提取模块既保护了用户隐私,又能提取恶意云机器人区别于正常用户的隐式特征,高准确率识别恶意云机器人。本发明主要针对薅羊毛、刷票等黑产场景,所述系统可以直接部署在企业的业务服务器端,识别恶意云机器人IP,减少经济损失;亦可帮助相关机关打击黑产犯罪。 | ||
搜索关键词: | 一种 场景 恶意 机器人 识别 方法 系统 | ||
【主权项】:
1.一种黑产场景下恶意云机器人的识别方法,包括以下步骤:/n(1)在服务器端实时收集客户端发来的待测流量;/n(2)对待测流量进行样本提取,并进一步提取样本中与恶意云机器人识别模型相对应的特征向量;/n(3)将上述待测流量的特征向量作为输入,通过该恶意云机器人识别模型进行识别;/n其中,所述恶意云机器人识别模型通过下述方法构建:/n在服务器端实时收集客户端发来的流量,存储并提取样本,使用恶意云机器人数据库对样本数据进行标注,若初始样本的客户端IP包含在该数据库中,则将该初始样本标记为恶意云机器人样本;反之,则标记为人类用户样本;/n对样本流量数据进行多层流量统计特征的提取,得到特征向量;/n基于机器学习方法,利用特征向量训练多种分类器,选取具有最优效果的分类器,得到恶意云机器人识别模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910660771.6/,转载请声明来源钻瓜专利网。