[发明专利]模型部署方法、服务器和计算机可读存储介质在审
申请号: | 202010266792.2 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111432022A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 邢军华;罗英群;吕令广 | 申请(专利权)人: | 深圳中兴网信科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24;G06N20/00;G06N3/02;G06K9/62 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;王淑梅 |
地址: | 518109 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 部署 方法 服务器 计算机 可读 存储 介质 | ||
1.一种模型部署方法,其特征在于,所述模型部署方法应用于服务器上,所述模型部署方法包括:
接收所需任务的数据集,根据所述数据集进行模型训练,得到训练后的神经网络模型;
在所述服务器上部署tensorflow serving服务框架;
基于所述tensorflow serving服务框架,将所述训练后的神经网络模型部署在所述服务器上;
响应参数设定指令,对所述tensorflow serving服务框架进行参数设定;
响应并发服务请求,基于参数设定后的所述tensorflow serving服务框架调用所述训练后的神经网络模型。
2.根据权利要求1所述的模型部署方法,其特征在于,所述接收所需任务的数据集,根据所述数据集进行模型训练,得到训练后的神经网络模型的步骤之后,在所述服务器上部署tensorflow serving服务框架的步骤之前,还包括:
确定所述训练后的神经网络模型的格式与所述tensorflow serving服务框架限定的格式不一致,对所述训练后的神经网络模型进行格式转换。
3.根据权利要求2所述的模型部署方法,其特征在于,在所述接收所需任务的数据集,根据所述数据集进行模型训练,得到训练后的神经网络模型的步骤,还包括:
记录所述训练后的神经网络模型的输入张量名称和输出张量名称,
在对所述训练后的神经网络模型进行格式转换的步骤之后,将格式转换后的输入和输出与所述训练后的神经网络模型的输入张量名称和输出张量名称进行对应。
4.根据权利要求1至3中任一项所述的模型部署方法,其特征在于,所述响应参数设定指令,对所述tensorflow serving服务框架进行参数设定的步骤,具体包括:
接收所述并发服务请求的配置信息,所述训练后的神经网络模型的模型信息以及所述服务器的硬件信息;
根据所述并发服务请求的配置信息,所述训练后的神经网络模型的模型信息以及所述服务器的硬件信息对所述tensorflow serving服务框架进行参数设定。
5.根据权利要求4所述的模型部署方法,其特征在于,所述并发服务请求的配置信息包括:并发服务请求的数量;
所述训练后的神经网络模型的模型信息包括:模型的存储规格;
所述服务器的硬件信息包括:图形处理器的数量和所述图形处理器显存规格。
6.根据权利要求4所述的模型部署方法,其特征在于,还包括:
部署Flask;
根据所述Flask对所述并发服务请求的进程数进行设定。
7.根据权利要求6所述的模型部署方法,其特征在于,所述服务器为Gunicorn服务器;和/或
服务器还部署有Nginx,
其中,所述Nginx向发出所述并发服务请求的客户端提供服务。
8.根据权利要求5所述的模型部署方法,其特征在于,还包括:
响应调用测试指令,向目标终端发送测试结果。
9.一种服务器,其特征在于,包括:
存储器,其上存储有计算机程序;
控制器,所述控制器执行所述计算机程序实现如权利要求1至8中任一项所述的模型部署方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时,实现如权利要求1至8中任一项所述的模型部署方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中兴网信科技有限公司,未经深圳中兴网信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010266792.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摆动式的农作物烘干装置
- 下一篇:一种芳香减压腰带