[发明专利]数据处理方法、装置、服务器及计算机可读存储介质在审
申请号: | 201911319986.8 | 申请日: | 2019-12-19 |
公开(公告)号: | CN111078415A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 张吉 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 服务器 计算机 可读 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
根据待分配的多个GPU中每个GPU的可用资源量,对图计算模型进行分块,生成多个模型块以及所述多个模型块之间的第一依赖关系;
根据每个所述模型块所需的第一资源量和所述每个GPU的可用资源量,对所述多个模型块分别分配GPU,生成模型块与GPU之间的对应关系,其中,所述对应关系中模型块所需的第一资源量小于或等于该模型块所对应的GPU的可用资源量;
根据所述对应关系将所述多个模型块分别加载至对应的GPU;
接收对所述图计算模型的图计算请求;
响应于所述图计算请求,通过所述多个GPU上所加载的所述多个模型块,按照所述第一依赖关系对所述图计算请求进行处理,生成图计算结果并输出。
2.根据权利要求1所述的方法,其特征在于,所述根据待分配的多个GPU中每个GPU的可用资源量,对图计算模型进行分块,生成多个模型块以及所述多个模型块之间的第一依赖关系,包括:
获取图计算模型中多个第一节点之间的第二依赖关系;
获取所述图计算模型所需的第二资源量;
根据所述第二资源量、所述多个GPU的数量以及每个GPU的可用资源量,按照所述第二依赖关系对所述图计算模型进行分块,生成多个模型块以及所述多个模型块之间的第一依赖关系。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第二资源量、所述多个GPU的数量以及每个GPU的可用资源量,按照所述第二依赖关系对所述图计算模型进行分块,生成多个模型块以及所述多个模型块之间的第一依赖关系,包括:
计算所述第二资源量和所述多个GPU的数量的比值,生成第三资源量,其中,所述第三资源量小于或等于所述每个GPU的可用资源量;
将所述图计算模型中的多个第一节点转换为有向无环图中的多个第二节点;
根据所述第三资源量和每个所述第二节点对应的第四资源量,按照所述第二依赖关系,对所述多个第二节点进行分割,生成多个子图以及所述多个子图之间的第三依赖关系,其中,每个子图对应的第五资源量小于或等于所述第三资源量;
按照所述多个第一节点与所述多个第二节点之间的转换关系,对所述多个第一节点进行分割,生成与所述多个子图对应的多个模型块,以及所述多个模型块之间的第一依赖关系,其中,任意一个子图对应的所述第五资源量为该子图对应的模型块所需的第一资源量。
4.根据权利要求1所述的方法,其特征在于,所述根据所述对应关系将所述多个模型块分别加载至对应的GPU,包括:
对于所述多个模型块中的任意一个目标模型块,将所述目标模型块加载至与所述目标模型块对应的目标GPU;
若所述目标GPU在加载所述目标模型块之后所剩余的可用资源量大于或等于所述目标模型块所需的第一资源量,则将所述目标模型块再次加载至所述目标GPU。
5.根据权利要求1所述的方法,其特征在于,所述响应于所述图计算请求,通过所述多个GPU上所加载的所述多个模型块,按照所述第一依赖关系对所述图计算请求进行处理,生成图计算结果并输出,包括:
响应于所述图计算请求,按照所述第一依赖关系,通过所述多个GPU依次运行各自加载的所述多个模型块,并将所述多个模型块中前一个模型块的计算的中间结果输入至下一个模型块进行计算,直至最后一个模型块对输入的中间结果进行计算,来生成图计算结果并输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911319986.8/1.html,转载请声明来源钻瓜专利网。