[发明专利]一种用于网页截图的脱敏、还原方法和系统在审

专利信息
申请号: 202111101389.5 申请日: 2021-09-18
公开(公告)号: CN113806806A 公开(公告)日: 2021-12-17
发明(设计)人: 陈生坚;范志建;李昌华;李仁杰;江文涛 申请(专利权)人: 罗普特科技集团股份有限公司;罗普特(厦门)系统集成有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F21/60
代理公司: 厦门福贝知识产权代理事务所(普通合伙) 35235 代理人: 郭涵炜
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 网页 截图 还原 方法 系统
【说明书】:

公开了一种用于网页截图的脱敏、还原方法和系统,包括递归遍历网页中所有元素,获取文本信息集合;利用正则表达式对元素文本信息进行敏感信息匹配,获取敏感信息集合;对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,构建文本图片替换信息集合;分别对脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至替换信息集合中;利用随机生成的密钥生成二维码图片替换初始脱敏图片的一边角像素,输出最终脱敏图片,利用密钥对替换信息集合进行加密生成的数据加密文件。该发明可以避免截图泄露敏感信息并能够在特定处理下还原。

技术领域

本发明涉及信息安全的技术领域,尤其涉及一种用于网页截图的脱敏、还原方法和系统。

背景技术

随着人脸检测识别、车辆检测识别、ocr识别等相关技术发展,在各种场景下应用也越来越广泛,在各种应用系统上展示也是越来越丰富的个人身份信息、手机信息、人脸信息、车辆信息等,同时,国家对个人隐私也是越来越重视,如何加强隐私保护,防范一些系统截图包含隐私信息流传问题亟需解决。

现如今各种应用系统展示和截图时无法支持自动隐藏人员姓名、身份证、手机、人脸图片、车辆图片、一些字典敏感文字信息,难免会造成截图泄露敏感信息;若对截图上的敏感文字信息进行人工脱敏,对于特定条件下需要对数据内容和数据来源信息进行还原则难以实现。

发明内容

为了解决现有技术中无法自动实现对网页截图的自动脱敏处理并在特定条件下的还原问题,本发明提出了一种用于网页截图的脱敏、还原方法和系统,用以解决上述技术问题。

根据本发明的第一方面,提出了一种用于网页截图的脱敏方法,包括:

S1:递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合;

S2:利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对元素文本信息进行敏感信息匹配,获取敏感信息集合;

S3:对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合;

S4:对原始图片进行人脸和车辆识别检测,分别得到包括人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至替换信息集合中;

S5:利用随机生成的密钥生成二维码图片替换初始脱敏图片的一边角像素,输出最终脱敏图片,并利用密钥对替换信息集合进行加密生成与脱敏图片对应的数据加密文件。

在一些具体的实施例中,步骤S3具体包括:

根据敏感信息集合的坐标信息对原始图片将对应位置区域像素使用R、G、B值均为255的白值填充,生成中间图片;

对中间图片进行OCR识别,获取包括文本信息和坐标信息的OCR识别集合;

利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对OCR识别集合进行敏感信息匹配,并更新补充至敏感信息集合中。凭借该步骤可以进一步利用OCR识别敏感文本,避免遗漏。

在一些具体的实施例中,步骤S3中脱敏文本图片的获取具体包括以下步骤:

根据敏感信息集合的坐标信息对原始图片进行遍历,获取集合中每一个对应坐标位置的像素区域,并提取像素区域的背景;

利用与敏感信息集合的文本长度信息生成替代内容文本,替代内容文本将敏感信息集合的文本替换为其他文本标识;

结合内容文本和背景填充至对应的敏感信息的像素区域内。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗普特科技集团股份有限公司;罗普特(厦门)系统集成有限公司,未经罗普特科技集团股份有限公司;罗普特(厦门)系统集成有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111101389.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top