[发明专利]基于机器学习的隐私数据处理方法、装置及电子设备有效
申请号: | 202010047788.7 | 申请日: | 2020-01-16 |
公开(公告)号: | CN110874491B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 陈凌;杨耀;刘磊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06Q10/06;G06Q40/02 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 隐私 数据处理 方法 装置 电子设备 | ||
1.一种基于机器学习的隐私数据处理方法,包括:
基于数据需求方的需求,从数据所有方的原始隐私数据中提取目标原始特征;
基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,其中,所述特征嵌入模型是基于包含预设原始特征的训练数据训练得到的,所述预设原始特征与所述目标原始特征的类型相同;
将所述目标原始特征的特征嵌入向量提供给所述数据需求方,所述特征嵌入向量用于辅助所述数据需求方基于机器学习进行建模。
2.根据权利要求1所述的方法,在所述基于特征嵌入模型确定所述目标原始特征的特征嵌入向量之前,还包括:
针对多种业务场景,基于与业务场景相关的标签和所述训练数据,训练得到多个特征嵌入模型,其中,一种业务场景对应训练出一个特征嵌入模型;
其中,所述基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,包括:
基于所述数据需求方的需求,确定所述数据需求方面对的目标业务场景,所述目标业务场景是所述多种业务场景中的一种;
基于所述目标业务场景对应的特征嵌入模型,确定所述目标原始特征的特征嵌入向量。
3.根据权利要求2所述的方法,其中,所述针对多种业务场景,基于与业务场景相关的标签和所述训练数据,训练得到多个特征嵌入模型,包括:
针对多种业务场景,基于与业务场景相关的标签和所述训练数据,进行深度学习得到多个特征嵌入模型。
4.根据权利要求1所述的方法,其中,在所述基于特征嵌入模型确定所述目标原始特征的特征嵌入向量之前,还包括:
基于所述训练数据进行无监督训练,得到所述特征嵌入模型。
5.根据权利要求4所述的方法,
所述特征嵌入模型包括word2vec、node2vec、item2vec、feature2vec中的任一种。
6.根据权利要求1-5任一项所述的方法,其中,所述将所述目标原始特征的特征嵌入向量提供给所述数据需求方,包括:
基于预设规则,对所述目标原始特征的特征嵌入向量进行分类;
将所述目标原始特征的特征嵌入向量和该特征嵌入向量的类型,提供给所述数据需求方。
7.根据权利要求1-5任一项所述的方法,其中,所述将所述目标原始特征的特征嵌入向量提供给所述数据需求方,包括:
对所述目标原始特征的特征嵌入向量进行加密;
将加密后的所述目标原始特征的特征嵌入向量提供给所述数据需求方。
8.根据权利要求1-5任一项所述的方法,
所述目标原始特征为单一特征,或者,所述目标原始特征为至少两个单一特征合并形成的耦合特征。
9.一种基于机器学习的隐私数据处理装置,包括:
第一特征提取模块,用于基于数据需求方的需求,从数据所有方的原始隐私数据中提取目标原始特征;
第一向量确定模块,用于基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,其中,所述特征嵌入模型是基于包含预设原始特征的训练数据训练得到的,所述预设原始特征与所述目标原始特征的类型相同;
第一数据提供模块,用于将所述目标原始特征的特征嵌入向量提供给所述数据需求方,所述特征嵌入向量用于辅助所述数据需求方基于机器学习进行建模。
10.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于数据需求方的需求,从数据所有方的原始隐私数据中提取目标原始特征;
基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,其中,所述特征嵌入模型是基于包含预设原始特征的训练数据训练得到的,所述预设原始特征与所述目标原始特征的类型相同;
将所述目标原始特征的特征嵌入向量提供给所述数据需求方,所述特征嵌入向量用于辅助所述数据需求方基于机器学习进行建模。
11.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于数据需求方的需求,从数据所有方的原始隐私数据中提取目标原始特征;
基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,其中,所述特征嵌入模型是基于包含预设原始特征的训练数据训练得到的,所述预设原始特征与所述目标原始特征的类型相同;
将所述目标原始特征的特征嵌入向量提供给所述数据需求方,所述特征嵌入向量用于辅助所述数据需求方基于机器学习进行建模。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010047788.7/1.html,转载请声明来源钻瓜专利网。