[发明专利]一种对个人健康医疗数据的系统化脱敏方法在审
申请号: | 202010978859.5 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112116973A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 左霖;邓涛 | 申请(专利权)人: | 山东健康医疗大数据有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F21/62 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250117 山东省济南市槐*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 个人 健康 医疗 数据 系统化 方法 | ||
1.一种对个人健康医疗数据的系统化脱敏方法,其特征在于,
包括脱敏数据准备、脱敏设置、建立脱敏工具库、脱敏审核、限制环境下开放5个步骤;
其中,
a)脱敏数据准备
根据业务目标确定开放数据内容,包括数据范围和类型;配套复制迁移目标数据到脱敏准备数据库的程序,自动完成脱敏数据集准备;
b)脱敏设置
操作员根据数据将要使用的业务场景需求,设置脱敏条件;
c)建立脱敏工具库
脱敏工具库是依据行业规范、法律规范、应用场景需求开发形成的程序工具组成的工具库;
d)脱敏审核
数据经程序脱敏后,就进入脱敏审核环节;该环节包括“程序全量审核”和“人工抽检审核”两部分;程序全量审核,是包括敏感词库和由分词技术、NLP、ORC,结合设置的脱敏条件形成“扫描程序”对脱敏后数据进行全量扫描,并审核标记出问题数据;人工抽检,是手动在“操作平台”抽查脱敏数据,并进行审核标记;
e)限制环境下开放
“限制环境”是按不同数据脱敏等级,配套相应监测限制措施的数据应用环境,在对应数据应用环境下开放数据。
2.根据权利要求1所述的方法,其特征在于,
脱敏条件包括字段和字段类型、选择脱敏工具;
其中,字段包括身份证号、性别、出生日期、籍贯;字段类型包括字符串、数值、图片、标记的;
选择脱敏工具是从“脱敏工具库中”选择已封装好的工具,并在选择后完成工具的作用属性设置。
3.根据权利要求2所述的方法,其特征在于,
设置脱敏后,即可控制数据导入程序脱敏。
4.根据权利要求3所述的方法,其特征在于,
程序脱敏过程是服务端按脱敏条件自动完成的延时任务,完成后将处理后的数据推入脱敏审核环节。
5.根据权利要求1所述的方法,其特征在于,
脱敏工具涵盖分词、NLP、OCR、加密的计算机技术,支持数据一致性脱敏、可逆性脱敏、泛化脱敏、保格式脱敏、遮蔽脱敏的脱敏方式;数据处理由选择脱敏工具处置。
偶联其它系统套件,支持导入数据、脱敏处理、建立关联关系、以及导出到目标数据库。
脱敏工具组合或单独调用时,拥有作用属性设置特性,可设置形成不同脱敏等级“组合服务”;另外还具备持续的机器学习和人工反馈-优化能力。全部脱敏工具组合形成可供操作员选择的脱敏工具库。
6.根据权利要求1所述的方法,其特征在于,
脱敏审核通过的数据推送到限制开放环境;未通过的,由调整脱敏工具和脱敏条件重新对准备数据进行脱敏。
7.根据权利要求1所述的方法,其特征在于,
限制环境包括:内网访问环境、VPN访问环境、互联网访问环境。
8.根据权利要求1或7所述的方法,其特征在于,
监测限制措施包括监测数据应用行为、应用环境、使用者行为、限制使用方式、限制使用目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东健康医疗大数据有限公司,未经山东健康医疗大数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010978859.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置