[发明专利]一种用于网页截图的脱敏、还原方法和系统在审
申请号: | 202111101389.5 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113806806A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 陈生坚;范志建;李昌华;李仁杰;江文涛 | 申请(专利权)人: | 罗普特科技集团股份有限公司;罗普特(厦门)系统集成有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郭涵炜 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 网页 截图 还原 方法 系统 | ||
1.一种用于网页截图的脱敏方法,其特征在于,包括:
S1:递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合;
S2:利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对所述元素文本信息进行敏感信息匹配,获取敏感信息集合;
S3:对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合;
S4:对所述原始图片进行人脸和车辆识别检测,分别得到包括人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对所述脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至所述替换信息集合中;
S5:利用随机生成的密钥生成二维码图片替换所述初始脱敏图片的一边角像素,输出最终脱敏图片,并利用所述密钥对替换信息集合进行加密生成与所述脱敏图片对应的数据加密文件。
2.根据权利要求1所述的用于网页截图的脱敏方法,其特征在于,所述步骤S3具体包括:
根据所述敏感信息集合的坐标信息对所述原始图片将对应位置区域像素使用R、G、B值均为255的白值填充,生成中间图片;
对所述中间图片进行OCR识别,获取包括文本信息和坐标信息的OCR识别集合;
利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对所述OCR识别集合进行敏感信息匹配,并更新补充至所述敏感信息集合中。
3.根据权利要求2所述的用于网页截图的脱敏方法,其特征在于,所述步骤S3中脱敏文本图片的获取具体包括以下步骤:
根据所述敏感信息集合的坐标信息对所述原始图片进行遍历,获取集合中每一个对应坐标位置的像素区域,并提取所述像素区域的背景;
利用与所述敏感信息集合的文本长度信息生成替代内容文本,所述替代内容文本将所述敏感信息集合的文本替换为其他文本标识;
结合所述内容文本和所述背景填充至对应的敏感信息的像素区域内。
4.根据权利要求1所述的用于网页截图的脱敏方法,其特征在于,所述步骤S5具体包括生成随机128位密钥,并将所述128位密钥生成100*100的二维码图片,利用所述二维码图片替换所述初始脱敏图片的的右下角像素,生成最终脱敏图片,并将被替换下的所述右下角像素内容加入所述替换信息集合中。
5.根据权利要求1所述的用于网页截图的脱敏方法,其特征在于,还包括对所述最终脱敏图片进行SHA256提取图片摘要信息,利用所述密钥对所述替换信息集合、生成时间、客户端IP、MAC地址和所述图片摘要信息进行加密生成数据加密文件。
6.一种用于网页截图的脱敏还原方法,包括输入如权利要求1-5中任一项所述的脱敏方法中生成的所述最终脱敏图片和所述数据加密文件,其特征在于,还包括:
识别所述最终脱敏图片上的二维码获得密钥,利用所述密钥对所述数据加密文件进行解密获得替换信息集合和图片摘要信息;
对所述最终脱敏图片进行SHA256提取摘要信息,响应与所述摘要信息与所述解密获得的图片摘要信息一致,遍历所述替换信息集合的每个替换数据填充所述最终脱敏图片上对应位置区域,还原图片信息。
7.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗普特科技集团股份有限公司;罗普特(厦门)系统集成有限公司,未经罗普特科技集团股份有限公司;罗普特(厦门)系统集成有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111101389.5/1.html,转载请声明来源钻瓜专利网。