[发明专利]机器学习模型与自定义算子的模板化部署方法有效

专利信息
申请号: 202010105170.1 申请日: 2020-02-20
公开(公告)号: CN111399853B 公开(公告)日: 2023-06-06
发明(设计)人: 何思佑 申请(专利权)人: 四川新网银行股份有限公司
主分类号: G06F8/60 分类号: G06F8/60;G06N20/00
代理公司: 成都智言知识产权代理有限公司 51282 代理人: 濮云杉
地址: 610094 四川省成都市成都*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 机器 学习 模型 自定义 算子 模板 部署 方法
【说明书】:

发明涉及机器学习模型与自定义算子的模板化部署方法,包括:包括:A.根据机器学习模型的预测过程设置通用模板;B.将用户输入的框架名称和机器学习模型的模型名称在配置文件中进行匹配,用配置文件中的相应字段替换通用模板中的替代符;C.根据通用模板生成可执行文件;D.在服务器中以容器的形式运行通用模板和用户上传的机器学习模型,将实例化后的机器学习模型加入到服务序列中;E.用户进行HTTP请求时,根据用户输入的模型ID或自定义算子ID在服务序列中查找机器学习模型实例,并调用模型实例中的预测方法计算后返回结果。本发明能够大幅度缩短机器学习模型的部署时间,显著的降低了在部署环节中的人员开发成本和时间成本。

技术领域

本发明涉及机器学习模型与自定义算子的部署方法,具体讲是机器学习模型与自定义算子的模板化部署方法。

背景技术

近年来,机器学习技术的应用十分广泛,多个行业的技术也因此发生了变革,如金融风控技术、图像识别技术、自动驾驶技术等。机器学习技术应用主要分为两个步骤:(1)训练模型:通过算法拟合数据,持久化一个可复用的模型;(2)部署模型:将模型部署为API(应用程序接口)供其他应用系统调用。前者主要被学术界深入研究,而后者在工业生产应用中是一个比较重要且复杂的环节。它的主要挑战在于常用的技术框架繁多,如:Sklearn、H2O、pyspark、TensorFlow、Keras、Pytorch等,每个框架生成的模型都需要使用一套完全不同的环境依赖和方法来部署调用,并且多数应用不仅会用到模型,还会使用算子(自定义代码)对输入数据进行大量的转化处理,这对模型部署的复杂逻辑处理能力要求较高。上述问题为模型的部署带来了过多的开发工作,大量增加了时间和人力成本。

在现有技术中实现对机器学习模型部署的方法有:

(1)通过MLeap:MLeap(machine learning pipelines)是一种常用的序列化格式和执行引擎。它将可用的机器学习模型持久化为一个MLeap Bundle格式的json文件,再使用Java语言统一运行环境,通过解析Json文件还原模型参数,规避运行环境和框架依赖的问题。

该方法的缺点是:MLeap Bundle的定义并不标准且并不兼容所有模型,并且MLeap的原始目的是为了解决spark MLlib和sciket-learn的模型相互转化的问题,对其他框架的支持较弱。最大的缺点是没有提供模型API(应用程序接口)快速发布的功能。

(2)通过KubeFlow:KubeFlow是基于Kubernetes的主流机器学习解决方案,它采用kubernetes+TensorFlow结合的方式,使用容器编排技术,一站式统一模型训练的集群化管理,并通过seldon core将模型部署为REST API形式。

该方法的缺点是:作为全力支持Tensorflow模型的框架,对于模型部署,其包含了过多的冗余功能,较为“笨重”,如训练步骤中的节点资源管理等。并且该框架的模型部署服务对自定义算子的支持十分薄弱,不能灵活组装模型与代码的pipeline。

上述现有方法实现对机器学习模型部署的步骤一般为:

1、使用原生框架实现模型训练,并保存模型文件。

2、针对模型文件写一个Web服务。

3、将服务打包放到Tomcat服务器中。

4、启动Tomcat服务。

这种部署方法比较复杂,且当模型更新时需重复2、3、4步骤,耗时长且难以对模型服务进行集中管理。

在现有技术中,还包括有用于工作流的模板化开发部署与实例化。而工作流要应对的问题主要是集成大量的无关联计算机程序,使其产生关联,该现有技术与机器学习模型的部署属于两种不同的应用领域。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010105170.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top