[发明专利]一种基于web日志的网站反爬虫方法在审
申请号: | 202111133369.6 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113868651A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 肖军弼;魏娇娇 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于web日志的网站反爬虫方法,该方法包含:首先获取web日志进行预处理,包括清除噪声数据、数据过滤等,并将其存储到关系数据库中;从web日志中提取观测序列作为HMM算法的训练集,得出爬虫检测模型;利用似然函数计算爬虫序列在HMM算法下的平均极大似然估计值,确定出爬虫的平均极大似然估计值区间;计算待检测序列的平均极大似然估计值,结合上一步获得的平均极大似然估计值区间判断待检序列是否为爬虫;最后,利用风格化迁移技术捕捉原始图像的风格与内容特征,并通过训练卷积神经网络将其转移到目标图像之上,完成图像重建,通过多次优化图像,生成难破解的验证码,应用于易被爬虫程序攻击的网站,以达到反爬虫的目的。 | ||
搜索关键词: | 一种 基于 web 日志 网站 爬虫 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111133369.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种红茶发酵设备及工艺
- 下一篇:一种提高纤维面料强度的生产工艺