[发明专利]数据处理方法、装置、设备、存储介质和产品在审
申请号: | 202210912390.4 | 申请日: | 2022-07-29 |
公开(公告)号: | CN115048675A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 邹泳彤;李俊杰;周润坤;胡琳 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G06K9/62;G06N3/02 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 李志健 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 产品 | ||
本申请涉及一种数据处理方法、装置、计算机设备、存储介质和产品,可用于信息安全领域,该方法包括:客户端在获取账户的账户数据后,可以基于账户数据确定账户的至少一个业务事件对应的业务特征;然后可以针对每个业务事件,对业务事件对应的各个业务特征进行统计,并基于统计结果确定账户数据的统计特征;还基于统计特征和各业务事件对应的业务特征,得到账户数据特征,并对账户数据特征进行本地差分保护处理,得到处理后的账户数据特征;最后,客户端可以将处理后的账户数据特征发送到服务端,以供服务端对处理后的账户数据特征进行分析,得到分析结果。采用本方法能够降低账户数据泄露的风险。
技术领域
本申请涉及信息安全技术领域,特别是涉及一种数据处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着使用互联网应用的人群逐渐增多,为了提高数据的多样性,需对数据进行分析。
传统技术中,采用k-匿名化、差分隐私、联邦学习、边缘计算、PATE框架等,能够在保护分析对象的账户数据的前提下,利用分析对象的账户数据进行分析。
然而,上述方法仍然难以保护分析对象的账户数据,存在账户数据泄露的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够降低账户数据泄露的风险的数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种数据处理方法。所述方法包括:
获取账户的账户数据,并基于所述账户数据确定所述账户的至少一个业务事件对应的业务特征;
针对每个业务事件,对所述业务事件对应的各个业务特征进行统计,并基于统计结果确定所述账户数据的统计特征;
基于所述统计特征和各业务事件对应的业务特征,得到账户数据特征,并对所述账户数据特征进行本地差分保护处理,得到处理后的账户数据特征;
将处理后的账户数据特征发送到服务端,以供所述服务端对所述处理后的账户数据特征进行分析,得到分析结果。
在其中一个实施例中,所述基于所述账户数据确定所述账户的至少一个业务事件对应的业务特征的步骤,包括:
获取所述业务事件的事件类型;
确定所述业务事件的统计周期,并基于所述账户数据,获取每个统计周期内所述业务事件在各个事件类型下的事件描述信息;
基于每个统计周期内所述业务事件在各个事件类型下的事件描述信息,确定业务事件的业务特征。
在其中一个实施例中,所述基于所述账户数据,获取每个统计周期内所述业务事件在各个事件类型下的事件描述信息,包括:
针对每个统计周期内所述事件类型的事件的发生情况,获取与所述发生情况对应的事件指示标识;
根据所述事件类型在各个统计周期的事件指示标识生成数组,并将所述数组作为所述事件类型下的事件描述信息。
在其中一个实施例中,所述对所述业务事件对应的各个业务特征进行统计,并基于统计结果确定所述账户数据的统计特征,包括:
对所述业务事件对应的各个业务特征进行统计,得到多个统计指标下的统计结果;
获取每个统计指标的证据权重;
根据所述证据权重获取每个统计指标的信息值,以及,获取任意两个统计指标之间的相关性;
从所述多个统计指标中获取所述信息值和所述相关性满足预设筛选条件的目标统计指标,并将所述目标统计指标的统计结果作为所述账户数据的统计特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210912390.4/2.html,转载请声明来源钻瓜专利网。