[发明专利]用于执行机器学习的分布式系统及其方法有效
申请号: | 201710764323.1 | 申请日: | 2017-08-30 |
公开(公告)号: | CN107622310B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 杨强;戴文渊;陈雨强;刘一鸣;石光川 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 徐璐璐;曾世骁 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 执行 机器 学习 分布式 系统 及其 方法 | ||
1.一种用于执行机器学习的分布式系统,包括:
参数服务器,用于维护多个机器学习模型的参数,其中,所述参数具有键值对的形式;以及
多个计算装置,被配置为并行地执行关于所述多个机器学习模型的算法,其中,所述算法为关于机器学习模型的训练算法或关于机器学习模型的预估算法,
其中,所述参数服务器将计算装置为了执行关于机器学习模型的训练算法而需要读取的参数提供给所述计算装置,以使所述计算装置利用读取的参数来执行所述训练算法,并且,所述参数服务器根据所述计算装置执行所述训练算法的结果来更新所述机器学习模型的参数;并且/或者,所述参数服务器将计算装置为了执行关于机器学习模型的预估算法而需要读取的参数提供给所述计算装置,以使所述计算装置利用读取的参数来执行所述预估算法,
其中,所述参数服务器包括至少一个服务器端和多个客户端,其中,客户端与计算装置一一对应,并且,对应的客户端和计算装置集成为一体,其中,所述至少一个服务器端用于保存所述多个机器学习模型的参数;每个客户端用于与一个或多个服务器端之间传送关于至少一个机器学习模型的算法所涉及的参数的参数操作指令,其中,与所述每个客户端对应的计算装置被配置为执行关于所述至少一个机器学习模型的算法,
其中,在所述参数操作指令中,相同键被压缩和/或合并。
2.根据权利要求1所述的分布式系统,其中,服务器端、客户端与计算装置一一对应,并且,对应的服务器端、客户端和计算装置集成为一体。
3.根据权利要求1所述的分布式系统,其中,所述每个客户端从对应的计算装置接收关于所述至少一个机器学习模型的算法所涉及的参数的参数操作请求,针对保存所述参数的一个或多个服务器端分别生成与所述参数操作请求相应的参数操作指令,并将生成的参数操作指令分别传送到所述一个或多个服务器端。
4.根据权利要求3所述的分布式系统,其中,所述每个客户端从所述一个或多个服务器端接收与所述参数的参数操作结果相应的参数操作指令,基于接收到的参数操作指令生成与所述参数操作请求之中的每一个对应的参数操作结果,并将生成的参数操作结果传送到对应的计算装置。
5.根据权利要求1所述的分布式系统,其中,所述至少一个服务器端按照单个键对应于多个值的形式来保存具有相同键的多个键值对。
6.根据权利要求1所述的分布式系统,其中,客户端与对应的计算装置之间针对每个算法,采用单独的句柄来进行交互。
7.根据权利要求3所述的分布式系统,其中,所述参数操作请求包括拉取操作请求和/或推送操作请求。
8.根据权利要求1所述的分布式系统,其中,相同键通过分桶方式或排序方式被合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710764323.1/1.html,转载请声明来源钻瓜专利网。