[发明专利]网页内容加密方法,加密装置及系统在审
申请号: | 201910215671.2 | 申请日: | 2019-03-21 |
公开(公告)号: | CN109977685A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 陈淑瑞;程瑞雪 | 申请(专利权)人: | 古联(北京)数字传媒科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/10 |
代理公司: | 北京市鼎立东审知识产权代理有限公司 11751 | 代理人: | 陈佳妹 |
地址: | 100071 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 加密 字体文件 加密装置 网页内容 原始字符 客户端 网页 用户访问网站 抓取 爬虫 加密操作 加密网页 影响用户 解密 转换 | ||
本发明公开了一种网页内容加密方法,加密装置及系统。其中方法包括如下步骤:获取待加密网页的原始字符与相应的初始字体文件包之间的对应关系;转换原始字符为加密字符,并将加密字符与初始字体文件包之间建立对应关系以形成加密字体文件包;将加密字体文件包发送到客户端以供客户端解密。通过对网页上的数据的字符进行加密操作,网页被爬取后,显示的内容是加密后的字符,有效的解决了数据被抓取的问题,保护了数据的版权。且相比于现有技术中采用短时间内不限制用户访问网站的次数进行防爬虫的手段,不会影响用户的体验。
技术领域
本发明涉及网络技术领域,尤其涉及一种网页内容加密方法,加密装置及系统。
背景技术
随着信息技术的发展,人们也越来越重视对数据版权的保护,如何防止数据被非法获取和传播,也逐渐成为关注的重点。
现在网络上有很多数据采集工具,人们通过这些工具可以轻易的获取到网站上数据,很多网站都会采取一些措施来防止网页上的数据被抓取,例如在短时间内限制用户访问网站的次数,或者隐藏页面链接地址,但是这些方案都不能有效的保护数据。
短时间内限制用户访问网站的次数,会使网页上的功能设计,变得更复杂,可能会影响用户的体验,给用户带来不便,而且不能彻底解决数据被抓取的问题,只是限制了数据被抓取的速度。隐藏页面链接地址,不能防止页面数据被抓取,有些工具可以不通过链接地址就能抓到数据。
发明内容
为解决现有技术的问题,本发明提供的网页内容加密方法通过对网页上的数据的字符进行加密操作,网页被爬取后,显示的内容是加密后的字符,有效的解决了数据被抓取的问题,保护了数据的版权。
为实现本发明目的提供的一种网页内容加密方法,包括如下步骤:获取待加密网页的原始字符与相应的初始字体文件包之间的对应关系;
转换原始字符为加密字符,并将加密字符与初始字体文件包之间建立对应关系以形成加密字体文件包;
将加密字体文件包发送到客户端以供客户端解密。
上述所述的网页内容加密方法,其中,转换原始字符为加密字符,并将加密字符与初始字体文件包之间建立对应关系以形成加密字体文件包;包括:
将原始字符转化为初始unicode码,建立初始unicode码与初始字体文件包之间的对应关系;
转换初始unicode码为加密unicode码,并将初始字体文件包与加密unicode码建立一一对应关系以形成加密字体文件包。
上述所述的网页内容加密方法,其中,转换初始unicode码为加密unicode码;包括:
获取待加密网页数据中字符所对应的unicode码值U1;将U1采用随机算法转换为U2;
判断U1是否出现过转换关系,若U1未出现过转换关系,则判断U2是否出现过转换关系,若U2未出现过转换关系则在哈希表中记录U1与U2之间的转换关系;
若U2出现过转换关系则需要对U1进行重新转换;
若U1已经出现过转换关系则直接调取U1在上一次转换过程中所对应的值。
上述所述的网页内容加密方法,其中,转换初始unicode码为加密unicode码;包括:
获取待加密网页数据中字符所对应的unicode码值U1;
对U1增加或减少一固定变量转换为U2。
本发明还公开了一种网页加密的装置,包括:
数据采集模块,用于获取待加密网页的原始字符与相应的初始字体文件包的对应关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于古联(北京)数字传媒科技有限公司,未经古联(北京)数字传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910215671.2/2.html,转载请声明来源钻瓜专利网。