[发明专利]用于预测信息的方法和装置有效
申请号: | 201910533286.2 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110245510B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 刘昊骋;许韩晨玺;陈浩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06Q10/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 预测 信息 方法 装置 | ||
本申请实施例公开了用于预测信息的方法和装置。该方法的一具体实施方式包括:获取用户的特征;将用户的特征分别输入至预先训练的第一模型和第二模型,得到用户的第一预测结果和第二预测结果,其中,第一模型和第二模型分别对应不同类别的机构,且基于各自对应的训练样本采用纵向联邦学习方法训练得到;汇总第一预测结果和第二预测结果,生成用户的预测结果。该实施方式涉及云计算领域,基于采用纵向联邦学习方法训练得到的第一模型和第二模型预测信息,提高了信息预测的准确度。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于预测信息的方法和装置。
背景技术
数据隔离和孤岛效应严重制约人工智能发展。不同机构拥有的数据维度和样本数量有限。由于数据安全性和个人信息保护等法律限制,不同机构的数据不能交换或共享,导致机构基于自身的数据和样本建立的模型效果较差,泛化能力弱,且不具备可复制性。
例如,金融机构拥有用户的存款、账户交易流水、贷款金额和消费记录等数据,但缺少用户浏览网站的行为和兴趣标签;互联网机构拥有用户的网站浏览行为、兴趣标签和地理位置信息,但缺少金融机构拥有的金融数据。
发明内容
本申请实施例提出了用于预测信息的方法和装置。
第一方面,本申请实施例提供了一种用于预测信息的方法,包括:获取用户的特征;将用户的特征分别输入至预先训练的第一模型和第二模型,得到用户的第一预测结果和第二预测结果,其中,第一模型和第二模型分别对应不同类别的机构,且基于各自对应的训练样本采用纵向联邦学习方法训练得到;汇总第一预测结果和第二预测结果,生成用户的预测结果。
在一些实施例中,第一模型和第二模型通过如下步骤训练:获取第一模型对应的第一训练样本和第二模型对应的第二训练样本,其中,第一训练样本包括第一样本用户的第一样本特征和第一样本标签,第二训练样本包括第二样本用户的第二样本特征;基于第一训练样本和第二训练样本采用纵向联邦学习方法对第一模型和第二模型进行训练。
在一些实施例中,基于第一训练样本和第二训练样本采用纵向联邦学习方法对第一模型和第二模型进行训练,包括:获取第一模型的当前梯度值和第二模型的当前梯度值;对第一模型的当前梯度值和第二模型的当前梯度值进行公钥加密,得到第一模型的当前公钥加密梯度值和第二模型的当前公钥加密梯度值;汇总第一模型的当前公钥加密梯度值和第二模型的当前公钥加密梯度值,得到当前公钥加密梯度值;对当前公钥加密梯度值进行私钥解密,得到当前私钥解密梯度值;基于当前私钥解密梯度值分别更新第一模型和第二模型。
在一些实施例中,基于第一训练样本和第二训练样本采用纵向联邦学习方法对第一模型和第二模型进行训练,还包括:获取第一模型的当前中间值和第二模型的当前中间值;对第一模型的当前中间值和第二模型的当前中间值进行公钥加密,得到第一模型的当前公钥加密中间值和第二模型的当前公钥加密中间值;基于第二模型的当前公钥加密中间值训练第一模型,以及基于第一模型的当前公钥加密中间值训练第二模型。
在一些实施例中,基于第一训练样本和第二训练样本采用纵向联邦学习方法对第一模型和第二模型进行训练,还包括:获取第一模型的当前损失值;对第一模型的当前损失值进行公钥加密,得到第一模型的当前公钥加密损失值;以及汇总第一模型的当前公钥加密梯度值和第二模型的当前公钥加密梯度值,得到当前公钥加密梯度值,包括:对第一模型的当前公钥加密损失值进行私钥解密,得到第一模型的当前私钥解密损失值;基于第一模型的当前私钥解密损失值汇总第一模型的当前公钥加密梯度值和第二模型的当前公钥加密梯度值,得到当前公钥加密梯度值。
在一些实施例中,在基于当前私钥解密梯度值分别更新第一模型和第二模型之后,还包括:获取第一模型的当前损失值和第二模型的当前损失值;确定第一模型的当前损失值和第二模型的当前损失值是否收敛;若第一模型的当前损失值和第二模型的当前损失值收敛,确定第一模型和第二模型训练完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910533286.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的信息安全处理方法
- 下一篇:一种基于区块链的文件加密存储方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置