[发明专利]一种机器学习模型通用部署方法在审
申请号: | 202310501556.8 | 申请日: | 2023-05-06 |
公开(公告)号: | CN116579440A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 魏可伟;张俊泽;刘伟;刘旺 | 申请(专利权)人: | 上海沄熹科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F8/60 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙晶伟 |
地址: | 200120 上海市浦东新区中国(上海)自由贸*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 学习 模型 通用 部署 方法 | ||
1.一种机器学习模型通用部署方法,其特征是将机器学习模型的数据预处理模块与机器学习模型分别独立部署,所述机器学习模型为Pytorch模型,
以独立服务形式部署所述数据预处理模块;
部署所述机器学习模型于torchserver框架内;
所述数据预处理模块与torchserver框架按照约定的协议进行通信。
2.根据权利要求1所述的一种机器学习模型通用部署方法,其特征是编写所述数据预处理模块的文件preprocess.py,根据所述文件preprocess.py所述数据预处理模块进行数据预处理包括:
获取全部所需的原始数据;
根据不同数据的使用方式进行特征扩展及特征交叉;
针对数值特征进行数据平滑、缩放及离散化处理,针对类别特征进行数值化和one-hot编码处理;
进行缺失值填充及异常值纠正;
将所有特征值按照特征顺序构建为预处理样本。
3.根据权利要求1所述的一种机器学习模型通用部署方法,其特征是所述部署所述机器学习模型于torchserver框架内,包括:
创建所述机器学习模型的mar文件,所述mar文件包含所述机器学习模型的处理文件handler.py和所述机器学习模型的结构定义文件model.py,所述处理文件handler.py继承基类BaseHandler,不重载相关逻辑,
配置所述机器学习模型的部署包配置文件config.properties,并设置相关参数,
构建所述机器学习模型的在线部署的文件,通过所述在线部署的文件安装打包工具及创建mar文件。
4.根据权利要求3所述的一种机器学习模型通用部署方法,其特征是所述设置相关参数,包括:
设置inference_address和management_address分别表示推理服务URL和管理服务URL;
设置grpc_inference_port和grpc_management_port分别表示推理服务grpc端口和管理服务grpc端口;
设置load_models表示部署的机器学习模型;
设置model_store表示mar文件所在路径;
设置enable_envvars_config=false,并设置service_envelope为相应值,通过相应值对应的envelope使所述机器学习模型正确地接收数据预处理模块的输出。
5.根据权利要求1所述的一种机器学习模型通用部署方法,其特征是数据预处理模块与torchserver框架按照http协议进行通信,并利用多维数组表示Pytorch模型的预处理样本。
6.一种机器学习模型通用部署装置,其特征是包括预处理服务部署模块和模型部署模块,
所述装置将机器学习模型的数据预处理模块与机器学习模型分别独立部署,所述机器学习模型为Pytorch模型,
处理服务部署模块以独立服务形式部署所述数据预处理模块;
模型部署模块部署所述机器学习模型于torchserver框架内;
所述数据预处理模块与torchserver框架按照约定的协议进行通信。
7.根据权利要求6所述的一种机器学习模型通用部署装置,其特征是预处理服务部署模块编写所述数据预处理模块的文件preprocess.py,所述数据预处理模块根据所述文件preprocess.py进行数据预处理包括:
获取全部所需的原始数据;
根据不同数据的使用方式进行特征扩展及特征交叉;
针对数值特征进行数据平滑、缩放及离散化处理,针对类别特征进行数值化和one-hot编码处理;
进行缺失值填充及异常值纠正;
将所有特征值按照特征顺序构建为预处理样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海沄熹科技有限公司,未经上海沄熹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310501556.8/1.html,转载请声明来源钻瓜专利网。