[发明专利]一种基于k8s的机器学习模型训练方法及系统在审
申请号: | 202210296057.5 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114676850A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 秦志强;王超勇;邱壮壮;魏星;韩鑫;张扬 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F8/61 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 陈翠兰 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 k8s 机器 学习 模型 训练 方法 系统 | ||
1.一种基于k8s的机器学习模型训练方法,其特征在于,包括以下步骤:
S1:依次构建模型训练所需的镜像、算法和数据集,添加模型信息,并创建模型训练输出和训练任务日志输出的文件夹;
S2:将模型训练所需的镜像、算法、数据集、模型信息和文件夹保存到数据库;
S3:扫描数据库中的任务训练数据表,查看可执行任务,如果有,执行S5,没有则等待下一次调度;
S4:查看K8S机器当前的资源是否满足任务执行需求,如果满足,执行S6,不满足,则等待下一次调度;
S5:构建任务所需的yaml文件;
S6:调用k8s创建执行模型训练的job和相关的pv和pvc,开始模型训练。
2.根据权利要求1所述的一种基于k8s的机器学习模型训练方法,其特征在于,所述S1中,构建模型所需的镜像包括以下步骤:
选择模型训练所需的基础镜像和模型训练任务执行所需的依赖;
添加关于镜像的描述信息,构建镜像信息并将这些信息保存到数据库中;
扫描需要创建镜像的任务表,查找需要执行的任务;
在NFS服务器的/images/image_name文件夹创建Dockerfile和requirement.txt文件;
docker通过Dockerfile和requirement.txt创建镜像;
把镜像push到私有镜像仓库。
3.根据权利要求1所述的一种基于k8s的机器学习模型训练方法,其特征在于,所述S1中,构建模型所需的算法包括以下步骤:
上传算法的压缩包;
添加算法的描述信息;
解压算法压缩包到NFS服务器/algorithms/algorithm_name文件夹下;
构建算法信息,并保存到数据库。
4.根据权利要求1所述的一种基于k8s的机器学习模型训练方法,其特征在于,所述S1中,构建模型所需的数据集包括以下步骤:
上传数据集压缩包;
添加数据集的描述信息;
解压数据集压缩包到NFS服务器下的/datasets/dataset_name文件夹下;
构建数据集信息,并保存到数据库。
5.根据权利要求1所述的一种基于k8s的机器学习模型训练方法,其特征在于,所述S7包括:
构建pv和pvc所需的yaml文件;
构建job所需的yaml文件。
6.根据权利要求1所述的一种基于k8s的机器学习模型训练系统,其特征在于,包括任务信息构建模块、任务信息存储模块和任务执行模块;
任务信息构建模块,用于依次构建模型训练所需的镜像、算法和数据集,添加模型信息,并创建模型训练输出和训练任务日志输出的文件夹;
任务信息存储模块,用于将模型训练所需的镜像、算法、数据集、模型信息和文件夹保存到数据库;
任务执行模块,用于扫描数据库中的任务训练数据表,查看可执行任务,如果没有,则等待下一次调度,如果有,查看K8S机器当前的资源是否满足任务执行的需求,如果不满足,等待下一次调度,如果满足,则构建任务所需的yaml文件,调用k8s创建执行模型训练的job和相关的pv和pvc,开始模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210296057.5/1.html,转载请声明来源钻瓜专利网。