[发明专利]一种基于大数据的网站篡改检测方法及其系统在审
申请号: | 201810273198.9 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108563948A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 邢婷 | 申请(专利权)人: | 合肥俊刚机械科技有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 230000 安徽省合肥市经济技术开发区青龙*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 篡改检测 待检测数据 大数据 原始数据信息 标准数据 更新数据 脚本 分解 数据库 扫描 网页 网页篡改检测 网页数据信息 相似度分析 相似度结果 反馈分析 匹配分析 数据信息 漏报率 误报率 检测 更新 匹配 嵌入 篡改 存储 反馈 | ||
1.一种基于大数据的网站篡改检测方法,其特征在于,包括以下步骤:
S1、在网络服务器的多个网页中嵌入网页篡改检测脚本;
S2、网络服务器启动篡改检测脚本,检测各网页当前的数据信息,并将检测到的当前数据信息分解为多个待检测数据片;
S3、扫描网站的原始数据信息,根据网站划分为不同的网页,并对网页内的原始数据信息分解为多个标准数据片,且对更新数据库进行扫描,将更新数据库中存储的各网页内的数据信息进行分解为多个更新数据片;
S4、将检测到的多个待检测数据片与标准数据片进行相似度分析,根据相似度分析,并反馈分析的相似度结果;
S5、对相似度结果进行判断,若相似度为1,则表明网站未发生篡改;若相似度小于1或大于,则表明网站被篡改或更新,并进入步骤S6;
S6、将待检测数据片与更新数据库中存储的更新数据片进行匹配分析,若待检测数据片与更新数据片完全匹配,则表明网站为更新后的网站,若待检测数据片与更新数据片不完全匹配,则表明网页出现篡改,并反馈匹配的结果。
2.根据权利要求1所述的一种基于大数据的网站篡改检测方法,其特征在于:所述待检测数据片与标准数据片相似度分析的过程中,定义待检测数据片中字符长度Ai(a1,a2,...,an),an表示第n个待检测数据片的长度,标准数据片中字符长度Bj(b1,b2,...,bm),bn表示第m个标准检测数据的长度,数据片中的字符、符号均进行量化定义,量化后的待检测数据片中字符量化集合CAi(cn1,cn2,...,cnn),量化后的标准数据片中字符量化集合DBi(dm1,dm2,...,dmm),计算出待检测数据片与标准数据片的相似度量化值该公式中m=n,为网页划分的数据片数目。
3.一种基于大数据的网站篡改检测系统,其特征在于:包括预处理模块、检测模块、扫描模块、数据划分模块、相似度分析模块、匹配对比模块和更新存储模块;
所述预处理模块用于将网络服务器内的过个网页中嵌入篡改检测脚本;
所述检测模块用于对嵌入篡改检测脚本的网页内的数据信息进行检测,并将检测的数据信息发送值数据划分模块;
所述扫描模块用于对网站内原始网页进行扫描,并对扫描获取的数据信息发送至数据划分模块;
所述数据划分模块分别接收检测模块发送的网页内的数据信息以及扫描模块发送的原始网页内的数据信息,并对接收的数据信息进行分解,分别得到多个待检测数据片和标准数据片;
所述相似度分析模块对接收的数据划分模块发送的待检测数据片和标准数据片进行相似度分析,根据相似度分析结果,将待检测数据片信息发送值匹配对比模块;
所述更新存储模块用于对网页更新后的数据信息进行特殊存储,且存储的形式为数据片形式;
所述匹配对比模块用于对待检测的数据片与更新存储模块中的更新数据片进行匹配,并反馈匹配的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥俊刚机械科技有限公司,未经合肥俊刚机械科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810273198.9/1.html,转载请声明来源钻瓜专利网。