[发明专利]分布式机器学习系统、装置和方法在审
申请号: | 201780056525.9 | 申请日: | 2017-07-17 |
公开(公告)号: | CN109716346A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 克里斯托弗·塞托;斯蒂芬·查尔斯·本茨;尼古拉斯·J·韦切 | 申请(专利权)人: | 河谷生物组学有限责任公司;河谷控股IP有限责任公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G16H10/60;G16H40/20;G16H50/50;G16H50/20 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 颜思晨 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提出了一种分布式在线机器学习系统。预期的系统包括许多私人数据服务器,每个私人数据服务器都具有本地私人数据。研究人员可以请求相关的私人数据服务器用其当地私人数据训练机器学习算法的实现,而无需对私人数据取消标识,或无需将私人数据暴露给未授权的计算系统。所述私人数据服务器还根据实际数据的数据分布生成合成数据或代理数据。然后,所述服务器使用所述代理数据来训练代理模型。当所述代理模型与训练后的实际模型足够相似时,所述代理数据、代理模型参数或其他学习到的知识可以被发送到一个或多个非私人计算设备。然后,可以将来自许多私人数据服务器的学习到的知识聚合到一个或多个训练后的全局模型中,而不暴露私人数据。 | ||
搜索关键词: | 私人数据 服务器 代理模型 代理数据 机器学习系统 服务器使用 合成数据 计算设备 计算系统 全局模型 实际模型 实际数据 数据分布 学习算法 学习系统 训练机器 在线机器 未授权 预期的 暴露 聚合 学习 服务 研究 | ||
【主权项】:
1.一种分布式机器学习系统,包括:多个私人数据服务器,每个私人数据服务器有权访问当地私人数据并具有至少一个建模引擎,其中所述多个私人数据服务器通过网络通信耦合至至少一个非私人计算设备;并且其中每个私人数据服务器在由存储在非暂时性计算机可读存储器的至少一个处理器软件指令执行时,致使所述每个私人数据服务器的至少一个建模引擎:接收模型指令,以根据机器学习算法的实现从至少一些当地私人数据中创建训练后的实际模型;通过用所述当地私人数据训练所述机器学习算法的实现,根据所述模型指令并根据所述至少一些当地私人数据创建所述训练后的实际模型,所述训练后的实际模型包括训练后的实际模型参数;从所述私人数据中生成多个私人数据分布,其中所述私人数据分布表示聚合的当地私人数据,所述聚合的当地私人数据用于创建所述训练后的实际模型;根据所述多个私人数据分布生成代理数据集;通过用所述代理数据集训练机器学习模型的类型,从所述代理数据集中创建训练后的代理模型,所述训练后的代理模型包括代理模型参数;根据所述代理模型参数和所述训练后的实际模型参数计算模型相似度得分;以及根据所述模型相似度得分将所述代理数据集通过所述网络发送至所述至少一个非私人计算设备。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河谷生物组学有限责任公司;河谷控股IP有限责任公司,未经河谷生物组学有限责任公司;河谷控股IP有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780056525.9/,转载请声明来源钻瓜专利网。
- 上一篇:计算机实现的隐私工程系统和方法
- 下一篇:扫描系统