[发明专利]一种基于深度学习的网站指纹识别方法在审
申请号: | 202010455374.8 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111626309A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 董昊辰;方仁贵;高晓辉;郭路路;何晓刚;何召阳;李克萌;刘兵;王欣宇;郗朝旭;谢鑫;赵岱翀;周欢;朱伟光 | 申请(专利权)人: | 北京墨云科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06T5/00;G06T7/11 |
代理公司: | 北京专赢专利代理有限公司 11797 | 代理人: | 刘梅 |
地址: | 100089 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 网站 指纹识别 方法 | ||
本发明公开了一种基于深度学习的网站指纹识别方法,包含以下步骤:A、利用网页解析和渲染技术获取网站页面图片;B、提取图片特征,对图片进行预处理;C、构建降噪模型,对页面图片数据进行降噪;D、构建深度学习模型,对页面图片进行指纹识别;E、将模型输出转化为对应的指纹类型,输出指纹分类,本发明的有益效果是:1、无需进行大量规则匹配,检测效率高。2、模型训练后可复用,维护人工成本低。3、检测灵活性高,误报低4、专业人员水平要求低5、模型可移植性强。
技术领域
本发明涉及计算机技术领域,具体是一种基于深度学习的网站指纹识别方法。
背景技术
传统的网站指纹检测需要对网站进行发包,获取网站的响应结果。根据网站的响应页面源码、响应头关键字段信息、网站指定路径的页面响应结果、网页后缀、网站robots.txt协议内容、网站错误页面内容等信息,利用规则匹配判断某种指纹的关键特征是否存在于上述信息中,并最终返回检测结果。
因此,网站的指纹检测需要提取多处关键位置信息,并遍历数万条指纹规则,依照规则对信息进行匹配,才能从数千种网站指纹类型中准确的判断出目标网站的指纹类型。随着现在网站指纹的不断更新以及新型类型不断增加,传统网站识别缺点日渐突出。一方面,网站的指纹识别规则难以维护,需要随着互联网网站的不断更新而更新以及修改指纹识别规则,极其浪费人力资源成本,而且还可能存在遗漏、错写规则等问题,识别效果日渐衰退。另一方面,随着网站指纹的种类不断增加,指纹规则同样日趋增多,单次扫描目标所需要进行的指纹规则匹配次数也随之不断增多,使得网站指纹识别的效率越来越差。
此外,由于目标网站作者的防范意识,其对于网站关键特征点的改动也难以防范。一旦网站作者对目标网站规则特征点进行改动,基于规则匹配的指纹检测手段将会误报,严重影响检测结果。
发明内容
本发明的目的在于提供一种基于深度学习的网站指纹识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于深度学习的网站指纹识别方法,包含以下步骤:
A、利用网页解析和渲染技术获取网站页面图片;
B、提取图片特征,对图片进行预处理;
C、构建降噪模型,对页面图片数据进行降噪;
D、构建深度学习模型,对页面图片进行指纹识别;
E、将模型输出转化为对应的指纹类型,输出指纹分类。
作为本发明的进一步技术方案:所述步骤A具体是:利用网页解析和渲染技术对要进行指纹识别的目标网站进行截图,获取目标页面。
作为本发明的进一步技术方案:所述步骤B利用图像处理算法,首先对图片进行几何变化,确保目标图像的形态准确性,其次对目标图像进行二值化处理,利用算法确定图像二值化阈值,然后对图像进行平滑处理,模糊图像,最后利用特征提取算法对图像进行特征提取,将图片中的关键特征点提取出来。
作为本发明的进一步技术方案:所述步骤C具体是:针对步骤B特征提取后的图像,将图像数据转换为深度学习模型可学习的数组数据并进行数据预处理,将处理后的图像数据利用DAE模型对图像数据进行降噪,产出降噪后的图像数据。
作为本发明的进一步技术方案:所述步骤D具体是:将网站指纹分类的图像数据每种取几千张分类图片,利用步骤B以及步骤C的数据预处理方法转换为图像数组数据,输入至CNN模型,进行模型的训练并进行函数调优、参数调优,直至训练出效果最佳的网站指纹识别模型。
作为本发明的进一步技术方案:所述网站指纹识别模型可以输入处理后的网站图像输出网站指纹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京墨云科技有限公司,未经北京墨云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010455374.8/2.html,转载请声明来源钻瓜专利网。