[发明专利]实现隐私保护的数据处理方法及装置有效
申请号: | 202010590733.0 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111475855B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 李龙飞;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈婧玥;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 隐私 保护 数据处理 方法 装置 | ||
1.一种实现隐私保护的数据处理方法,包括:
获取原始数据记录和对应的业务标签;所述原始数据记录中包括多条原始传感器数据,其由用户终端中的多个传感器进行采集而得到;所述业务标签对应针对用户的业务预测任务,所述业务预测任务至少包括以下中的一项任务:健康指标预测、运动状态识别、设备轨迹识别;
判断所述原始数据记录中是否包含敏感传感器数据,该敏感传感器数据反映用户做出若干特定隐私行为中的至少一种;
在判断出包含若干条敏感传感器数据的情况下,利用预先确定的若干条脱敏传感器数据,替换所述原始数据记录中的所述若干条敏感传感器数据,得到脱敏数据记录,其中若干条敏感传感器数据和若干条脱敏传感器数据对应相同的若干个传感器;
将所述原始数据记录输入数据脱敏模型,得到脱敏处理结果;
基于所述脱敏处理结果和所述脱敏数据记录,确定脱敏处理损失;
将所述脱敏处理结果输入业务预测模型中,得到业务预测结果,所述业务预测模型用于执行所述业务预测任务,所述业务预测模型基于多条原始数据记录和对应的多个业务标签进行预先训练而得到;
基于所述业务预测结果和所述业务标签,确定业务预测损失;
基于所述脱敏处理损失和业务预测损失,训练所述数据脱敏模型;训练后的数据脱敏模型用于对目标原始数据记录进行脱敏处理。
2.根据权利要求1所述的方法,其中各条原始传感器数据包括观测值序列,该观测值序列由传感器在多个预定时刻采集到的多个观测值组成。
3.根据权利要求1所述的方法,其中,所述多个传感器中包括以下中的至少一个:重力传感器,位置传感器,加速度传感器,角速度传感器,心率传感器。
4.根据权利要求1所述的方法,其中,所述若干特定隐私行为包括用户设定的禁止采集的行为和/或用户未授权采集的行为,所述业务预测任务对应用户授权的业务。
5.根据权利要求1所述的方法,其中,所述若干特定隐私行为中包括第一隐私行为;其中,判断所述原始数据记录中是否包含敏感传感器数据,包括:
基于预先设定的传感器与特定隐私行为之间的映射关系,从所述多条原始传感器数据中确定与所述第一隐私行为对应的若干条第一原始数据;
基于所述若干条第一原始数据,判断用户是否做出所述第一隐私行为;
在判断出用户做出所述第一隐私行为的情况下,将所述若干条第一原始数据归入所述若干条敏感传感器数据中。
6.根据权利要求5所述的方法,其中,基于所述若干条第一原始数据,判断用户是否做出所述第一隐私行为,包括:
将所述若干条第一原始数据输入预先训练的第一行为预测模型中,得到预测结果,指示用户是否做出所述第一隐私行为。
7.根据权利要求5所述的方法,其中,基于所述若干条第一原始数据,判断用户是否做出所述第一隐私行为,包括:
判断其中各条第一原始数据是否在各自对应的预设区间内;
在判断出均在各自对应的预设区间内的情况下,判定用户做出所述第一隐私行为。
8.根据权利要求1所述的方法,其中,所述若干条脱敏传感器数据中包括对应于第一传感器的第一脱敏传感器数据,其基于以下步骤预先确定:
获取多条第一原始传感器数据,其由多个用户终端中的多个第一传感器采集得到;
对所述多条第一原始传感器数据进行平均处理,得到所述第一脱敏传感器数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010590733.0/1.html,转载请声明来源钻瓜专利网。