[发明专利]一种服务提供方法、装置、服务器及计算机可读存储介质在审
申请号: | 201811550026.8 | 申请日: | 2018-12-18 |
公开(公告)号: | CN111340230A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 孔建钢;王琤;杨江华;裴文谦;莫简豪;朱中涛 | 申请(专利权)人: | 北京小桔科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务 提供 方法 装置 服务器 计算机 可读 存储 介质 | ||
本申请提供了一种服务提供方法、装置、服务器及计算机可读存储介质,其中,该方法包括:接收用户的服务创建请求,其中,服务创建请求中包含目标网络模型;根据服务创建请求以及模型参数配置信息,创建与目标网络模型对应的目标服务实例,其中,模型参数配置信息包含有网络模型对应的框架配置参数,框架配置参数为用于将对应框架类型的网络模型创建为服务实例。本申请实施例通过使用户在以目标网络模型生成服务实例时,根据预先保存的模型参数配置信息,自动配置目标网络模型所属的环境参数,而不再需要用户手动的配置,提升了将网络模型部署为服务实例的效率。
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种服务提供方法、装置、服务器及计算机可读存储介质。
背景技术
深度学习技术在社会生产发展中起着越来越重要的作用,目前已经广泛应用于交通、金融、零售、互联网、制造业等行业。在技术上,涌现出了一批如Tensorflow、PyTorch、Caffe、MXNet等深度学习框架和开发平台,越来越多的企业和个人采用这些框架开发深度学习算法训练模型并将模型应用于推理/预测任务。
一般来说,企业和个人可以将模型发布成推理服务,既可以用于自身业务的推理/预测,也可发布为公有云服务为其客户服务。
推力服务是指在深度学习框架上,通过指定模型运行推理/预测任务并将推理/预测的结果返回。通常,模型在某一深度学习框架上通过执行深度学习算法训练得出,训练出的模型可以导出模型文件,通过将该模型文件部署到对应的模型镜像(Serving)上执行推理/预测任务,为用户提供推理服务。
发明内容
有鉴于此,本申请实施例的目的在于提供一种服务提供方法、装置、服务器及计算机可读存储介质,能够提升将网络模型部署为服务实例的效率。
根据本申请的一个方面,提供一种服务提供方法,所述方法包括:
接收用户的服务创建请求,其中,所述服务创建请求中包含目标网络模型;
根据所述服务创建请求以及模型参数配置信息,创建与所述目标网络模型对应的目标服务实例,其中,所述模型参数配置信息包含有网络模型对应的框架配置参数,所述框架配置参数为用于将对应框架类型的网络模型创建为服务实例。
在一些实施例中,所述根据所述服务创建请求以及模型参数配置信息,创建与所述目标网络模型对应的目标服务实例的步骤,包括:
获得所述目标网络模型所属的目标模型框架类型;
根据所述目标模型框架类型,以及所述模型参数配置信息,获得与所述目标模型框架类型对应的目标模型镜像信息,其中,所述目标模型镜像信息表征与所述目标模型框架类型具有对应关系的配置参数;
基于所述目标模型镜像信息处理所述目标网络模型,生成所述目标服务实例。
在一些实施例中,所述服务创建请求中还包含有模型框架信息,所述获得所述目标网络模型所属的目标模型框架类型的步骤,包括:
读取所述模型框架信息记录的模型框架类型,获得所述目标模型框架类型。
在一些实施例中,所述目标网络模型中包含有目标记录信息,所述目标记录信息中记录有所述目标网络模型所属的模型框架类型;
所述获得所述目标网络模型所属的目标模型框架类型的步骤,包括:
读取所述目标记录信息,获得所述目标模型框架类型。
在一些实施例中,所述服务创建请求中还包含有目标服务参数,所述目标服务参数表征用户所需服务处理能力;
在所述基于所述目标模型镜像信息处理所述目标网络模型,生成所述目标服务实例的步骤之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小桔科技有限公司,未经北京小桔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811550026.8/2.html,转载请声明来源钻瓜专利网。