[发明专利]一种隐私数据的处理方法及装置有效
申请号: | 201911260166.6 | 申请日: | 2019-12-10 |
公开(公告)号: | CN110929285B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 林博 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 隐私 数据 处理 方法 装置 | ||
本说明书公开了一种隐私数据的处理方法及装置,所述方法包括:对正则表达式进行价值评估计算,以得到所述正则表达式的价值评分;其中,所述正则表达式用于从隐私数据中提取正则特征;所述正则表达式的价值评分,与所述正则表达式包含的信息量正相关;将所述正则表达式与隐私数据集合中的隐私数据进行匹配,并获取所述正则表达式与所述隐私数据集合中的隐私数据匹配成功的次数;根据所述正则表达式的价值评分和所述匹配成功的次数,计算与所述隐私数据集合中的隐私数据对应的正则特征;其中,所述正则特征用于训练机器学习模型。应用本方案,可以令构建得到的正则特征能够更好地刻画隐私数据的特性。
技术领域
本申请涉及人工智能领域,尤其涉及一种隐私数据的处理方法及装置。
背景技术
在人工智能领域,机器学习是从海量的数据中发掘隐含的数据规律的一种常用的技术手段。通过将大量原始数据作为训练样本,来训练机器学习模型,可以高效的发掘出这些数据中隐含的数据规律,并基于发掘出的数据规律,来进行业务运营;例如,可以基于大量的用户交易数据进行机器,来训练风控模型,并利用风控模型来识别用户发起的交易是否具有风险。
而在实际应用中,在用户的隐私数据参与机器学习模型训练的情况下,为了保障用户的隐私安全,这些隐私数据中所包含的数据特征,通常并不能直接作为训练特征,输入至机器学习模型进行训练。
发明内容
有鉴于此,本申请公开了一种隐私数据的处理方法及装置。
根据本申请实施例的第一方面,公开了一种隐私数据的处理方法,包括:
对正则表达式进行价值评估计算,以得到所述正则表达式的价值评分;其中,所述正则表达式用于从隐私数据中提取正则特征;所述正则表达式的价值评分,与所述正则表达式包含的信息量正相关;
将所述正则表达式与隐私数据集合中的隐私数据进行匹配,并获取所述正则表达式与所述隐私数据集合中的隐私数据匹配成功的次数;
根据所述正则表达式的价值评分和所述匹配成功的次数,计算与所述隐私数据集合中的隐私数据对应的正则特征;其中,所述正则特征用于训练机器学习模型。
根据本申请实施例的第二方面,公开了一种隐私数据的处理装置,包括:
价值评分获取模块,对正则表达式进行价值评估计算,以得到所述正则表达式的价值评分;其中,所述正则表达式用于从隐私数据中提取正则特征;所述正则表达式的价值评分,与所述正则表达式包含的信息量正相关;
匹配结果获取模块,用于将所述正则表达式与隐私数据集合中的隐私数据进行匹配,并获取所述正则表达式与所述隐私数据集合中的隐私数据匹配成功的次数;
正则特征构建模块,用于根据所述正则表达式的价值评分和所述匹配成功的次数,计算与所述隐私数据集合中的隐私数据对应的正则特征;其中,所述正则特征用于训练机器学习模型。
以上技术方案中,在基于正则表达式对隐私数据进行数据处理,从隐私数据中提取正则特征时,由于将正则表达式包含的信息量也作为参考因素之一,将与正则表达式包含的信息量正相关的价值评分,也作为计算参数,来计算与隐私数据集合中的隐私数据对应的正则特征,使得从隐私数据中提取出的正则特征能够更好地刻画隐私数据的特性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书文本一同用于解释原理。
图1是本说明书示出的一种隐私数据的处理的情景示例图;
图2是本说明书示出的一种隐私数据的处理方法的流程示意图;
图3是本说明书示出的一种信息量的计算方法的示例图;
图4是本说明书示出的一种匹配能力评分的计算方法的示例图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911260166.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置