[发明专利]页面的生成方法、装置、电子设备及计算机可读介质在审
申请号: | 202010713440.7 | 申请日: | 2020-07-22 |
公开(公告)号: | CN111783006A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 黄富华 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F16/958;G06F16/951;H04L29/06 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 生成 方法 装置 电子设备 计算机 可读 介质 | ||
本公开涉及一种页面的生成方法、装置、电子设备及计算机可读介质,属于计算机技术领域。该方法包括:获取生成当前页面所需的页面数据;随机生成所述页面数据的数据名称,并根据所述页面数据生成所述页面的超文本文件;根据所述页面数据的数据名称生成对应的页面样式文件;将所述页面样式文件引入所述页面的超文本文件,并根据引入所述页面样式文件后的所述页面的超文本文件生成所述页面。本公开通过随机生成所述页面数据的数据名称,可以防止网络爬虫从页面中获取数据,以较低的成本提升页面的安全性。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种页面的生成方法、页面的生成装置、电子设备及计算机可读介质。
背景技术
随着互联网的发展,网站作为大量信息的载体,许多访问量高、信息量多的网站都会有很多网络爬虫自动抓取网站上的数据,这样可能会对网站造成不利的影响。
现有的防爬虫方案主要是将网页的一些重要数据使用图片进行展示,或者通过添加验证码的方式防止网络爬虫获取数据,但是这样的方法成本比较高,步骤也较为复杂。
鉴于此,本领域亟需一种能够以较低的成本有效防止网络爬虫获取网页数据的方法。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种页面的生成方法、页面的生成装置、电子设备及计算机可读介质,进而至少在一定程度上以较低的成本有效防止网络爬虫获取网页中的数据。
根据本公开的第一个方面,提供一种页面的生成方法,包括:
获取生成当前页面所需的页面数据;
随机生成所述页面数据的数据名称,并根据所述页面数据生成所述页面的超文本文件;
根据所述页面数据的数据名称生成对应的页面样式文件;
将所述页面样式文件引入所述页面的超文本文件,并根据引入所述页面样式文件后的所述页面的超文本文件生成所述页面。
在本公开的一种示例性实施例中,所述方法还包括:
在所述超文本文件中随机插入干扰标签,其中,所述干扰标签为与所述页面的生成无关的标签。
在本公开的一种示例性实施例中,所述超文本文件包括文件头部,所述在所述超文本文件中随机插入干扰标签,包括:
在所述超文本文件的文件头部中随机插入干扰标签。
在本公开的一种示例性实施例中,所述随机生成所述页面数据的数据名称,包括:
根据所述页面数据的数据内容确定所述页面数据中的关键数据;
随机生成所述页面数据中的关键数据的数据名称。
在本公开的一种示例性实施例中,所述随机生成所述页面数据的数据名称,包括:
随机生成多个具有唯一识别码的字符串,并将多个所述字符串分别作为所述页面数据中各组数据的数据名称。
在本公开的一种示例性实施例中,所述随机生成所述页面数据的数据名称,包括:
随机生成多个随机字符串,并将一固定字符串分别与多个所述随机字符串进行组合,得到所述页面数据中各组数据的原始数据名称;
将所述原始数据名称通过散列算法分别转化为多个为散列字符串,并将多个所述散列字符串分别作为所述页面数据中各组数据的数据名称。
在本公开的一种示例性实施例中,所述方法还包括:
获取所述数据名称的长度阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010713440.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种矿用自卸车的混合驱动系统
- 下一篇:一种阿维巴坦纳的制备方法