[发明专利]数据处理的方法及装置有效
申请号: | 202010085081.5 | 申请日: | 2020-02-10 |
公开(公告)号: | CN111310204B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 刘昊骋;方灵鹏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06N20/00 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;臧建明 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
本申请实施例提供一种数据处理的方法及装置,涉及数据处理技术领域,具体包括:第一服务器可以获取用户标识对应于所述第一机构的第一用户特征,并将第一用户特征输入设置于所述第一服务器的第一模型,并利用所述第一模型输出第一预测结果;第二服务器可以获取用户标识对应于所述第二机构的第二用户特征,并将第二用户特征输入设置于所述第二服务器的第二模型,并利用所述第二模型输出第二预测结果。第二服务器将第二预测结果发送给第一服务器,则第一服务器可以汇总第一预测结果和第二预测结果,得到全面、准确的目标预测结果。
技术领域
本申请涉及数据处理的大数据技术领域,尤其涉及一种数据处理的方法及装置。
背景技术
在大数据领域,数据的多样、完整程度对数据分析具有较大影响。
现有技术中,由于机构之间的竞争或法律限制等原因,不同机构通常具有较为孤立的数据,在基于神经网络的建模中,各机构通常基于自身的数据和样本建立模型。例如,在金融机构中,银行拥有用户的存款、账户交易流水、贷款金额和消费记录等数据,金融机构通常只能基于自身的上述数据建模;在互联网机构中,互联网企业拥有用户的网站浏览行为、兴趣标签和地理位置信息,互联网机构通常也只能根据自身的上述数据建模。
因为现有技术中各机构的模型只是基于自身数据训练,往往不能得到准确的预测结果。
发明内容
本申请实施例提供一种数据处理的方法及装置,以解决现有技术中识别交通信号灯的准确度不高的技术问题。
本申请实施例第一方面提供一种数据处理的方法,应用于第一服务器,所述第一服务器属于第一机构;所述方法包括:
获取用户标识对应于所述第一机构的第一用户特征;将所述第一用户特征输入设置于所述第一服务器的第一模型;所述第一模型为:所述第一服务器基于所述第一机构的训练样本以及第二机构的训练样本,采用纵向联邦学习方法训练得到的;所述第二机构的用户特征与所述第一机构的用户特征不同;利用所述第一模型输出第一预测结果;接收来自第二服务器的第二预测结果;所述第二服务器属于所述第二机构;所述第二预测结果为:所述第二服务器中的第二模型根据所述用户标识对应于所述第二机构的第二用户特征输出的;所述第二模型为:所述第二服务器基于所述第一机构的训练样本以及所述第二机构的训练样本,采用纵向联邦学习方法训练得到的;汇总所述第一预测结果和所述第二预测结果,得到目标预测结果。第一机构的第一服务器中设置第一模型,第二机构的第二服务器中设置第二模型,第一模型和第二模型为各自的服务器基于所述第一机构的训练样本以及第二机构的训练样本,采用纵向联邦学习方法训练得到的,因此,第一模型输出的预测结果与第二模型输出的预测结构可以进行汇总,得到全面、准确的预测结果。
可选的,所述第一服务器设置有第一可信执环境TEE设备,所述第二服务器设置有第二TEE设备,所述方法还包括:基于所述第一TEE设备、所述第一机构对应的第一样本数据、所述第二TEE设备和所述第二机构对应的第二样本数据,采用纵向联邦学习方法训练得到所述第一模型。这样第一TEE设备和第二TEE设备可以采用硬件加密方式,取代了同态加密中的基于加密后数据求聚合,在enclave里明文聚合,这样效率大大增加。
可选的,所述基于所述第一TEE设备、所述第一机构对应的第一样本数据、所述第二TEE设备和所述第二机构对应的第二样本数据,采用纵向联邦学习方法训练得到所述第一模型,包括:
根据所述第一机构对应的第一样本数据训练得到第一预设模型;
将所述第一预设模型设置在所述第一TEE设备中;
利用所述第一TEE设备计算所述第一预设模型的第一中间值,并硬件加密所述第一中间值,得到第一加密中间值;
接收来自所述第二TEE设备的第二加密中间值;所述第二加密中间值为:所述第二TEE设备利用第二预设模型计算并加密得到的;所述第二预设模型为:利用所述第二机构对应的第二样本数据训练得到的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010085081.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:3D人体网格获取方法及装置
- 下一篇:基于知识图谱的自然语言问答方法及装置