[发明专利]一种网络模型训练的控制方法、系统有效
申请号: | 202110682636.9 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113254239B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 别晓辉;别伟成;单书畅 | 申请(专利权)人: | 视睿(杭州)信息科技有限公司 |
主分类号: | G06F9/54 | 分类号: | G06F9/54;G06N3/04;G06N3/08 |
代理公司: | 杭州华知专利事务所(普通合伙) 33235 | 代理人: | 张德宝 |
地址: | 310000 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 模型 训练 控制 方法 系统 | ||
1.一种网络模型训练的控制方法,其特征在于,所述方法包括:
客户端获取训练请求,并发送至云服务中间端;其中,所述训练请求包括网络模型类型、训练数据和训练任务标识;
所述云服务中间端接收所述训练请求,解析得到所述训练数据,并将其保存至数据库,并根据所述网络模型类型和训练任务标识,将所述训练请求转义成第一消息体通过网络发送至计算服务端;其中,所述第一消息体包括键和值,所述键包括命令键、类型、任务识别符、数据设置、标签和名称中的一种或多种,所述值为所述键的具体的值;
所述计算服务端根据所述第一消息体,从所述数据库下载训练数据对网络模型进行训练;
其中,所述云服务中间端接收所述训练请求,解析所述训练数据并保存至数据库,并根据所述网络模型类型和训练任务标识,将所述训练请求转换成第一消息体发送至计算服务端,包括:
所述云服务中间端接收所述训练请求,解析得到所述训练数据,并将其保存至数据库;
所述云服务中间端根据网络模型和训练任务标识,生成用于控制网络模型进行训练的第一消息体;其中,所述的第一消息体的格式为Json格式,所述的第一消息体带有特定命令;特定命令包括发起训练、停止训练、重启训练、计算资源反馈中至少一种,第一消息体即为通过消息体传输的信息;
所述云服务中间端将所述第一消息体,通过RocketMQ组件发送至计算服务端。
2.根据权利要求1所述的方法,其特征在于,所述计算服务端根据所述第一消息体,从所述数据库下载训练数据对网络模型进行训练,包括:
所述计算服务端根据所述第一消息体提供的数据设置字段,通过pymysql模块包的一个接口函数获取所述训练数据的在数据库的云存储路径信息;
根据所述云存储路径信息,采用多线程并发的方式下载所述训练数据到服务器磁盘指定位置;
通过python标准库Subprocess开启一个子进程以调用网络模型训练代码,并获取训练参数传递至所述子进程,同时连接所述子进程的输入、输出、错误管道,保存所述子进程的进程号,将所述进程号与所述第一消息体的任务识别符进行绑定后保存到字典类型的变量中;
所述子进程调用网络模型训练代码后,根据所述训练参数对所述网络模型进行训练。
3.根据权利要求2所述的方法,其特征在于,在所述子进程调用网络模型训练代码后,根据所述训练参数对所述网络模型进行训练之后,还包括:
在所述子进程运行时,主程序通过开启的通信管道实时监控所述子进程;
将监控结果发送至所述云服务中间端,所述云服务中间端将其转发至所述客户端,所述客户端对所述监控结果进行显示。
4.根据权利要求3所述的方法,其特征在于,所述监控结果包括正常训练的监控结果和非正常训练的监控结果;
当所述监控结果为正常训练的监控结果时,将训练结果、进度实时发送至所述云服务中间端,所述云服务中间端将其转发至所述客户端;
当所述监控结果为非正常训练的监控结果时,向所述云服务中间端返回错误信息,所述云服务中间端将其转发至所述客户端进行显示。
5.根据权利要求3所述的方法,其特征在于,在将所述监控结果发送至所述云服务中间端,所述云服务中间端将其转发至所述客户端,所述客户端对所述监控结果进行显示之后,还包括:
当所述监控结果为位置错误或者在需要协调资源时,客户端获取停止训练请求,并发送至所述云服务中间端;所述停止训练请求包括训练任务标识和所述第一消息体的任务识别符;
所述云服务中间端接收所述停止训练请求,并根据所述训练任务标识,将停止训练请求转换成第二消息体发送至计算服务端;
所述计算服务端根据所述第二消息体,停止所述网络模型的训练。
6.根据权利要求5所述的方法,其特征在于,所述计算服务端根据所述第二消息体,停止所述网络模型的训练,包括:
所述计算服务端从所述第二消息体获取所述任务识别符,并根据所述任务识别符获取所述子进程的进程号;
所述计算服务端根据所述进程号调用python标准库的os模块的接口函数os.kill(p.process)杀死所述子进程,以停止所述网络模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视睿(杭州)信息科技有限公司,未经视睿(杭州)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110682636.9/1.html,转载请声明来源钻瓜专利网。