[发明专利]一种Web动态网页源码自动化尝试获取方法有效
申请号: | 201810777443.X | 申请日: | 2018-07-16 |
公开(公告)号: | CN109067853B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 刘雁鸣 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F16/955 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 邓东坡 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 web 动态 网页 源码 自动化 尝试 获取 方法 | ||
1.一种Web动态网页源码自动化尝试获取方法,其特征在于,包括以下步骤:
S1,构造http请求,
S2,发送http请求并接收http响应信息,
S3,输出http响应信息形成记录,
S4,遍历记录,若http响应信息中的状态码为200,则将该条记录输出至结果文件,否则不处理;
所述S1中构造http请求的具体步骤为:输入身份信息和待测目标URL,输入一个Ascii字符设置在待测目标URL尾部组成新的URL,身份信息自动设置在http请求的头部,形成http请求;
所述S3中,所述输出http响应信息形成记录过程中,输出响应信息中的状态码、响应头中的Content-Length字段及本次使用的Ascii字符形成一条记录;
所述Ascii字符从%00开始,Ascii字符范围为%00~%FF,通过本次使用的Ascii字符形成一条记录后,更换Ascii字符,循环执行步骤S1、S2、S3,直至256个Ascii字符均被使用,每个Ascii字符对应的http请求获得的响应信息中的状态码、响应头中的Content-Length字段及本次使用的Ascii字符均输出形成一条记录;
所述S4中,将结果文件中的任一Ascii字符设置在待测目标URL尾部组成新的URL进行访问,即可获得Web动态网页源码。
2.如权利要求1所述的一种Web动态网页源码自动化尝试获取方法,其特征在于,所述的身份信息包括cookie、token、referer、csrf-token、Authorization。
3.如权利要求1所述的一种Web动态网页源码自动化尝试获取方法,其特征在于,所述S2中,所述的发送http请求并接收http响应信息的方法包括linuxshell的curl命令、python的httplib库方法。
4.如权利要求1所述的一种Web动态网页源码自动化尝试获取方法,其特征在于,所述S4的具体步骤为:遍历记录,如果http响应信息中的状态码为200,则输出Content-Length字段及其对应的Ascii字符到结果文件中,同时记录项总数加一,并对不同的Content-Length值分别进行计数;否则不处理,访问下一条记录,直至遍历所有记录,所述结果文件中的每项记录中的Ascii字符为可获取Web动态页面源码的字符。
5.如权利要求4所述的一种Web动态网页源码自动化尝试获取方法,其特征在于,所述不同的Content-Length值的计数中,每项计数信息包括ascii字符、计数值。
6.如权利要求5所述的一种Web动态网页源码自动化尝试获取方法,其特征在于,如果结果文件中记录项总数为256,则自动删除结果文件中Content-Length值计数最大的对应的记录项,否则不需要处理结果文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810777443.X/1.html,转载请声明来源钻瓜专利网。