[发明专利]一种针对用户数据的全自动数据隐私保护系统有效

专利信息
申请号: 202111409364.1 申请日: 2021-11-25
公开(公告)号: CN113836585B 公开(公告)日: 2022-04-22
发明(设计)人: 许封元;吴昊 申请(专利权)人: 南京大学
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 南京苏创专利代理事务所(普通合伙) 32273 代理人: 张学彪
地址: 210046 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 用户 数据 全自动 隐私 保护 系统
【权利要求书】:

1.一种针对用户数据的全自动数据隐私保护系统,其特征在于,包括以下模块:

智能打包模块:用于根据用户提供的智能应用程序进行智能模块提取,并将其重新打包为可执行的智能应用;

保护器生成模块:用于针对所打包的智能应用自适应地生成数据保护器,并通过将该保护器嵌入到原始智能应用程序中的方式来自动增强该智能应用;

其中,所述智能打包模块包括以下组件:

IM Finder组件:通过静态程序分析技术查找原始智能应用程序中标志智能模块的关键特征,并输出智能模块的调用接口,即IM协议接口;

IM Slicer组件:从输出的IM协议接口开始,通过静态程序切片技术提取出与智能模块相关的全部代码,即用户输入的预处理代码和推断结果的后处理代码;

IM Repacker组件:用于对切分出的程序代码进行语句翻译和排列,并自动打包成可独立运行的智能应用;

所述保护器生成模块的工作步骤具体包括:

1)利用数据保护器对系统预设或用户提供的测试数据集进行隐私保护数据转换,并将转换后的数据发送到重新打包的智能应用以执行智能推理;

2)优化器收集智能推理结果并评估数据转换后的智能推理准确性和隐私保护有效性,进而根据评估结果对数据保护器进行微调;

3)重复上述步骤1)、2),直到评估结果达到预设阈值或者重复步骤达到预设步数上限,以生成个性化数据保护器;

4)通过程序插桩技术将优化后的数据保护器作为图片过滤器透明地嵌入到用户提供的智能应用程序中,实现后续用户输入数据的隐私保护。

2.根据权利要求1所述的一种针对用户数据的全自动数据隐私保护系统,其特征在于,所述IM Finder组件会根据系统预设的深度学习计算特征,对原始智能应用程序所包含的资源文件、本地计算库和字节码进行分析查找,并根据查找结果实现IM协议接口的追踪,其追踪机制包括以下情况:

Ⅰ、如果直接在字节码中找到了深度学习计算特征,则提取相应的API作为IM协议接口;

Ⅱ、如果在本地计算库中找到了深度学习计算特征,则提取对应本地库中的JNI,进行翻译,并将字节码中这些JNI的调用点所在函数,作为IM协议接口;

Ⅲ、如果在资源文件中找到了深度学习模型文件,则进一步在本地计算库或字节码中搜索深度学习模型的加载点,若模型加载点在本地库中,则继续按照情况Ⅱ提取JNI并完成后续操作,若模型加载点在字节码中,则提取加载点的返回值,作为预期的IM协议接口。

3.根据权利要求1所述的一种针对用户数据的全自动数据隐私保护系统,其特征在于,所述IM Slicer组件通过后向静态切片技术找到所有用于确定IM协议接口中参数的程序代码,并通过前向静态切片技术找到所有用于解码IM协议返回值的程序代码;具体切片过程包括:

首先,IM Slicer组件会构造一个程序依赖图,程序依赖图的节点是程序语句,边是语句间数据依赖或控制依赖,包括四种类型,即常规执行路径、函数调用路径、函数返回路径和全局变量访问路径;程序依赖图构建完成之后,IM Slicer组件会从IM协议接口开始,沿着其构建的程序依赖图进行切片。

4.根据权利要求1所述的一种针对用户数据的全自动数据隐私保护系统,其特征在于,所述IM Repacker组件对语句的排序过程具体包括:首先将语句以函数为单位组织进行整理,并根据这些函数之间是否存在调用关系来对函数进行分组;而后把每个函数组中没有任何调用者的函数计作头函数,并基于“先写后读”的原则编排头函数的调用顺序。

5.根据权利要求1所述的一种针对用户数据的全自动数据隐私保护系统,其特征在于,所述步骤1)中,初始的数据保护器首先通过语义保留图像风格转换来去除测试数据集中与智能任务无关的信息。

6.根据权利要求1所述的一种针对用户数据的全自动数据隐私保护系统,其特征在于,所述步骤2)中,优化器采用基于信息删减的数据增强技术作为微调方案,其微调过程具体包括:将原始数据、保护数据和智能应用在保护数据上的推理结果作为输入,通过评估隐私保护的有效性和智能推理准确率来启发式地搜索一组新配置,并据此指导数据保护器更新其数据转换策略。

7.根据权利要求1所述的一种针对用户数据的全自动数据隐私保护系统,其特征在于,所述步骤2)中,优化器分别通过可用性指数UI和保护指数PI来衡量智能应用在保护数据上的推理准确性以及保护数据的隐私保护有效性,其中UI是使用智能应用在保护数据上得到的推理准确度除以其在原始数据上的推断准确度计算而来,PI是将保护前后图像中未匹配的人脸数除以总人脸数计算而来。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111409364.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top