[发明专利]电子文档中敏感数据的脱敏处理方法及装置在审

专利信息
申请号: 202110588208.X 申请日: 2021-05-28
公开(公告)号: CN113204949A 公开(公告)日: 2021-08-03
发明(设计)人: 刘俊佳 申请(专利权)人: 中国建设银行股份有限公司
主分类号: G06F40/186 分类号: G06F40/186;G06F21/62
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 贾磊;李辉
地址: 100033 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 电子 文档 敏感数据 处理 方法 装置
【说明书】:

发明公开了一种电子文档中敏感数据的脱敏处理方法及装置,涉及自动程序设计领域,该方法包括:获取待脱敏电子文档对应的模板文件内容;对模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;根据模板文件内容中待脱敏的数据项,查找待脱敏电子文档中相应数据项的数据内容;对查找出的数据内容进行脱敏处理;将脱敏处理后的数据内容与待脱敏电子文档中未进行脱敏处理的数据内容进行整合;根据整合后的数据,合成脱敏后的电子文档。本发明能够对OFD等板式格式文档中包含的敏感信息进行脱敏处理,以保护用户的敏感信息不被泄露。

技术领域

本发明涉及自动程序设计领域,尤其涉及一种电子文档中敏感数据的脱敏处理方法及装置。

背景技术

本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

电子文档存在容易被复制、传播速度快等特点,若处理不当,容易导致电子文档中的敏感数据泄密。因此对电子文档中敏感数据进行脱敏处理,能够有效保护电子文档中的敏感数据不被泄密。

OFD(全称为Open Fixed-layout Document)是我国自主研发的版式格式标准,能够方便地对各类电子文档进行存储、读取以及编辑。在当今的电子时代,无论是电子商务、电子公务,还是信息发布、数字出版、档案管理、电子交换等都不可避免地涉及到了版式应用,因此也就不可避免地依赖于版式文档格式。

作为我国自主研发的电子版式文档,OFD文档具有独立于创建它的应用软件、硬件、操作系统、显示或打印它的输出设备,可有效保留原始文档的外观和完整性,还具有跨平台、自由共享特点,被广泛应用于电子文档的信息存储与传递。OFD文档存储信息的类型也变得多样化,覆盖了文字、图形、二维码等。对OFD文档内容中包含的敏感数据进行脱敏处理,能够对OFD文档内容起到有效保护。

目前,市面上对PDF文档内容中敏感数据的脱敏处理方案是使用Adobe公司提供的开源SDK对PDF文档内容进行解析处理或使用其它解析方法或软件对PDF文档进行解析处理。在解析处理时,通过字符串匹配算法实现PDF文档中敏感数据的定位和确认,并进行脱敏。由于PDF文档具有特殊的编码格式,直接将对PDF文档内容中敏感数据进行脱敏时采用的字符串匹配算法应用OFD文档内容,存在效果较差的问题;且由于现有的脱敏功能及算法要依托于第三方的软件或者解析程序,存在安全隐患问题。

针对上述问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例中提供了一种电子文档中敏感数据的脱敏处理方法,用以解决现有技术直接将对PDF文档内容中敏感数据进行脱敏处理的方法应用于OFD文档,字符匹配效果较差,且存在安全隐患的技术问题,该方法包括:获取待脱敏电子文档对应的模板文件内容;对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项;根据所述模板文件内容中待脱敏的数据项,查找所述待脱敏电子文档中相应数据项的数据内容;对查找出的数据内容进行脱敏处理;将脱敏处理后的数据内容与所述待脱敏电子文档中未进行脱敏处理的数据内容进行整合;根据整合后的数据,合成脱敏后的电子文档。

进一步地,在对所述模板文件内容进行分解,定位模板文件内容中待脱敏的数据项之前,所述方法还包括:获取自定义配置的待脱敏的数据项。

进一步地,获取自定义配置的待脱敏的数据项,包括:在可视化界面中显示所述模板文件内容中的各个数据项;接收用户对一个或多个数据项的选定指令;根据接收到的选定指令,获取自定义配置的待脱敏的数据项。

进一步地,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:以预览的形式,输出脱敏后的电子文档。

进一步地,在根据整合后的数据,合成脱敏后的电子文档之后,所述方法还包括:接收文档保存指令;根据所述文档保存指令,保存脱敏后的电子文档。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110588208.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top