[发明专利]一种基于爬虫的外挂精准标记与识别方法和装置有效
申请号: | 202110795217.6 | 申请日: | 2021-07-14 |
公开(公告)号: | CN113407804B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 周胜;余皇南;郭月丰 | 申请(专利权)人: | 杭州雾联科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/906;G06Q30/0601;G06N20/00;A63F13/70 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘翠香 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 爬虫 外挂 精准 标记 识别 方法 装置 | ||
1.一种基于爬虫的外挂精准标记与识别方法,其特征在于,包括:
基于爬虫检测外挂样本的更新情况;
当检测到外挂样本更新时,下载所述外挂样本;
确定所述外挂样本是否为外挂,所述确定所述外挂样本是否为外挂包括:利用白名单对所述外挂样本进行筛选,得到正常环境下运行的程序,并打上白名单标签;
当确定所述外挂样本为外挂时,对所述外挂进行归类和标记;
当检测到运行程序的文件时,将所述文件与所述归类和标记的外挂进行对比,识别出所述文件是否为当前游戏的外挂;
基于用户反馈的是否误报的情况,对所述外挂的归类和标记进行修正;
所述确定所述外挂样本是否为外挂还包括:
经过筛选之后,对所述外挂样本进行上传次数校验,当上传次数大于预设次数阈值时,则确定所述外挂样本为外挂;
所述对所述外挂进行归类和标记包括:
根据所述外挂的文件静态信息对所述外挂进行归类和标记,所述文件静态信息包括图标信息、文件格式和静态字符串;
根据所述外挂下载时经历的路径信息对所述外挂进行归类和标记;
利用分词和机器学习方式,根据所述外挂的商品命名和描述对所述外挂进行归类和标记。
2.根据权利要求1所述的基于爬虫的外挂精准标记与识别方法,其特征在于,当利用所述文件静态信息得到的归类和标记与利用下载时经历的路径信息得到的归类和标记不同时,由人工方式进行标记和识别。
3.根据权利要求2所述的基于爬虫的外挂精准标记与识别方法,其特征在于,所述下载所述外挂样本包括:
计算所述外挂样本的更新时长,下载预设时间内更新的压缩包或程序并进行解压缩,计算每个文件的hash。
4.一种基于爬虫的外挂精准标记与识别装置,其特征在于,包括:
更新检测部件,用于基于爬虫检测外挂样本的更新情况;
下载部件,用于当检测到外挂样本更新时,下载所述外挂样本;
外挂确定部件,用于确定所述外挂样本是否为外挂,所述确定所述外挂样本是否为外挂包括:利用白名单对所述外挂样本进行筛选,得到正常环境下运行的程序,并打上白名单标签;经过筛选之后,对所述外挂样本进行上传次数校验,当上传次数大于预设次数阈值时,则确定所述外挂样本为外挂;
归类和标记部件,用于当确定所述外挂样本为外挂时,对所述外挂进行归类和标记;根据所述外挂的文件静态信息对所述外挂进行归类和标记,所述文件静态信息包括图标信息、文件格式和静态字符串;根据所述外挂下载时经历的路径信息对所述外挂进行归类和标记;利用分词和机器学习方式,根据所述外挂的商品命名和描述对所述外挂进行归类和标记;
识别部件,用于当检测到运行程序的文件时,将所述文件与所述归类和标记的外挂进行对比,识别出所述文件是否为当前游戏的外挂;
修正部件,用于基于用户反馈的是否误报的情况,对所述外挂的归类和标记进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州雾联科技有限公司,未经杭州雾联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110795217.6/1.html,转载请声明来源钻瓜专利网。