[发明专利]神经网络模型训练方法、装置及电子设备在审
申请号: | 201911006317.5 | 申请日: | 2019-10-22 |
公开(公告)号: | CN112699990A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 浦世亮;虞抒沁 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;高莺然 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 装置 电子设备 | ||
本申请实施例提供了神经网络模型训练方法、装置及电子设备,该方法包括获取训练集;在训练集中选取样本图像输入到神经网络模型中进行训练;获取神经网络模型的训练状态信息,其中,训练状态信息表示神经网络模型的性能;按照训练状态信息,确定当前的性能模式;按照当前的性能模式对应的训练方式,对神经网络模型进行训练。获取神经网络模型的训练状态信息,以确定性能模式,并按照性能模式对应的训练方式,对神经网络模型进行训练,能够按照性能模式对应的训练方式,对神经网络模型进行训练,以提高各阶段训练的准确度,从而提高了神经网络模型的准确度,并且能够有效减少用户等待时间。
技术领域
本申请涉及计算机技术领域,特别是涉及神经网络模型训练方法、装置及电子设备。
背景技术
随着人工智能技术的不断发展,人工智能应用正在以场景化、碎片化的形式涌现,为了帮助深度学习零基础用户开发自己的AI(人工智能)算法,可以将深度学习训练系统经过一定封装提供给用户简单易用的接口,从而赋予用户AI开发能力。在这种情况下,用户往往只需要提交训练素材并标定,即可一键训练得到自己的深度学习算法模型。
相关技术中,上述一键训练功能是由底层的训练系统完成,一般的训练系统采用一固定的学习策略,在训练初始阶段生成学习策略,学习策略在整个训练过程中不会改变,按照这种方式可以执行完流程,但是固定的学习策略无法有效适用于多种训练任务,训练得到的神经网络模型准确度低。
发明内容
本申请实施例的目的在于提供一种神经网络模型训练方法、装置及电子设备,以实现增加神经网络模型的准确度。具体技术方案如下:
第一方面,本申请实施例提供了一种神经网络模型训练方法,所述方法包括:
获取训练集,其中,所述训练集包括多个样本图像;
在所述训练集中选取样本图像输入到神经网络模型中进行训练;
获取所述神经网络模型的训练状态信息,其中,所述训练状态信息表示所述神经网络模型的性能;
按照所述训练状态信息,确定当前的性能模式;
按照所述当前的性能模式对应的训练方式,对所述神经网络模型进行训练。
在一种可能的实施方式中,所述方法还包括:
将待分析图像输入到训练后的所述神经网络模型中进行分析,得到所述待分析图像的分析结果,所述分析结果包括目标检测结果、目标分类结果或目标分割结果中的至少一种。
在一种可能的实施方式中,在所述获取训练集之前,所述方法还包括:
获取多个包括标注信息的样本图像,并将所述多个样本图像划分为训练集、验证集及测试集。
在一种可能的实施方式中,所述按照所述训练状态信息,确定当前的性能模式,包括:
将所述训练状态信息进行量化,得到量化指标;
根据所述量化指标的变化情况,确定当前的性能模式。
在一种可能的实施方式中,所述根据所述量化指标的变化情况,确定当前的性能模式,包括:
在所述量化指标的变化情况表示所述神经网络模型的性能上升时,确定当前的性能模式为性能上升;
在所述量化指标的变化情况表示所述神经网络模型的性能不收敛时,确定当前的性能模式为不收敛;
在所述量化指标的变化情况表示所述神经网络模型的性能稳定时,确定当前的性能模式为性能稳定;
在所述量化指标的变化情况表示所述神经网络模型的性能下降时,确定当前的性能模式为性能下降。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911006317.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:洗鞋设备的洗鞋方法
- 下一篇:用于控制空调室内机的方法和空调室内机