[发明专利]神经网络模型获取方法及系统、数据处理方法在审

专利信息
申请号: 202110026477.7 申请日: 2021-01-08
公开(公告)号: CN112766476A 公开(公告)日: 2021-05-07
发明(设计)人: 唐亮;刘松 申请(专利权)人: 北京迈格威科技有限公司
主分类号: G06N3/063 分类号: G06N3/063;G06N3/04;G06N3/08;G06K9/62;G06F9/455
代理公司: 北京钲霖知识产权代理有限公司 11722 代理人: 李英艳;李志新
地址: 100080 北京市海淀区科*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 模型 获取 方法 系统 数据处理
【说明书】:

本公开提供一种由计算机执行的神经网络模型获取方法、数据处理方法、神经网络模型获取系统、数据处理装置、电子设备和计算机可读存储介质。由计算机执行的神经网络模型获取方法包括:步骤S11,通过管理模块接收参数获取模块发送的超参数,并发送超参数至训练模块;步骤S12,通过训练模块基于超参数训练神经网络模型,确定训练评价信息,并发送至管理模块;步骤S13,通过管理模块发送训练评价信息至参数获取模块;步骤S14,通过参数获取模块基于训练评价信息调整神经网模型的超参数,并发送至管理模块;步骤S15,重复步骤S11至S14,通过管理模块确定最终的超参数,并获取对应的神经网络模型。获取神经网络模型更高效,成本低,性能好,质量高。

技术领域

本公开一般地涉及数据处理领域,具体涉及一种由计算机执行的神经网络模型获取方法、数据处理方法、神经网络模型获取系统、数据处理装置、电子设备和计算机可读存储介质。

背景技术

目前,在一些任务中,例如对图像进行分类识别的广泛发展与应用,离不开深度学习。在数据处理过程中,往往需要通过经过训练的神经网络模型来进行数据处理。例如,图片分类中用到的卷积神经网络(Convolutional Neural Networks,CNN)网络框架从简单的VGG(Visual Geometry Group Network)模型、到残差网络(Residual Network,ResNet)再到Imagenet等等。

在训练神经网络模型之前,需要先确定神经网络模型的结构和基础参数,即超参数。需要对超参数进行优化,选择一组最优超参数,以提高会后训练的性能和效果,为得到高质量的神经网络模型奠定基础。

而超参数的数量以及范围往往都是不确定的,所以它的搜索空间可能是一个极大的多维空间。目前常见的调优做法是通过手动调参以及手动地管理实验,但是人为确定或手动搜索超参数,不仅耗时、成本高,而且依赖于经验,得到的结果不可靠。

发明内容

为了解决现有技术中存在的上述问题,本公开的第一方面提供一种由计算机执行的神经网络模型获取方法,应用于神经网络模型获取系统,所述神经网络模型获取系统至少包括:管理模块、参数获取模块、训练模块;其中,所述由计算机执行的神经网络模型获取方法包括:步骤S11,通过所述管理模块接收所述参数获取模块发送的超参数,并发送所述超参数至所述训练模块;步骤S12,通过所述训练模块基于所述超参数训练所述神经网络模型,确定训练评价信息,并将所述训练评价信息发送至所述管理模块;步骤S13,通过所述管理模块发送所述训练评价信息至所述参数获取模块;步骤S14,通过所述参数获取模块基于所述训练评价信息调整所述神经网模型的超参数,并将调整后的超参数发送至所述管理模块;步骤S15,重复所述步骤S11至所述步骤S14,通过所述管理模块确定所述神经网络模型最终的超参数,并获取所述最终的超参数对应的神经网络模型。

在一实施例中,所述神经网络模型获取系统还包括:指令获取模块;所述由计算机执行的神经网络模型获取方法,还包括:通过所述指令获取模块获取创建信息,并发送至所述管理模块,其中,所述创建信息包括神经网络模块的初始化信息及搜索范围;通过所述管理模块发送所述创建信息至所述参数获取模块;通过所述参数获取模块基于所述创建信息确定所述神经网络模型初始的超参数,并发送至所述管理模块。

在一实施例中,所述神经网络模型获取系统基于Kubernetes设置,所述训练模块包括多个job容器;所述步骤S12包括:通过任一所述job容器,基于所述超参数训练所述神经网络模型,确定所述训练评价信息。

在一实施例中,所述神经网络模型获取系统还包括:存储模块;所述由计算机执行的神经网络模型获取方法,还包括:所述管理模块将所述最终的超参数和/或所述最终的超参数对应的神经网络模型发送至所述存储模块。

在一实施例中,所述存储模块为分布式文件存储的数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110026477.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top