[发明专利]一种深度学习模型的训练方法及装置在审

专利信息
申请号: 201810258256.0 申请日: 2018-03-27
公开(公告)号: CN108734193A 公开(公告)日: 2018-11-02
发明(设计)人: 李诚;周晓;朱才志 申请(专利权)人: 合肥麟图信息科技有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N99/00
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 马敬;项京
地址: 230000 安徽省合肥市高新区*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 中间参数 学习 样本 目标函数 批次数据 特征向量 点距离 分类准确率 分类目标 函数添加 计算训练 距离目标 模型训练 中心点 加载 更新 应用
【说明书】:

发明实施例提供了一种深度学习模型的训练方法及装置,方法为:首先训练得到中间深度学习模型;计算训练样本集中各个样本的特征向量以及计算中心点距离目标函数的中间参数的初始值;将中心点距离目标函数添加到中间深度学习模型中并加载中间参数的初始值,得到目标深度学习模型;利用当前目标深度学习模型,计算当前批次数据中各个样本的特征向量,并更新中间参数的参数值;计算中心点距离目标函数的函数值和分类目标函数的函数值,并判断是否符合结束训练的条件;如果否,调整当前目标深度学习模型的参数,导入下一批次数据并进行模型训练;如果是,结束训练。应用本发明实施例提供的方案可以提升深度学习模型的分类准确率。

技术领域

本发明涉及机器学习技术领域,特别是涉及一种深度学习模型的训练方法及装置。

背景技术

包含分类目标函数的深度学习模型,即带有分类任务的深度学习模型(深度学习分类模型),其通用架构是:首先采用若干组“卷积-非线性激励-池化”模块提取出数据分布的特征,然后采用“全连接”或者“1×1卷积”将特征缩减到指定数量个类别,最后通过softmax等分类目标函数实现类别分值的推断。而将包含分类目标函数的深度学习模型与中心点距离目标函数相结合,能够使得深度学习模型学习到的数据分布更加紧凑。

对于包含分类目标函数的深度学习模型,根据每一类别所包含的各个样本的特征向量可以计算得到该类别的中心点,该类别中各个样本到该类别的中心点的距离为中心点距离。在深度学习模型的训练过程中,可以通过减小中心点距离,来提升深度学习模型的分类准确率。

目前,在深度学习模型的训练过程中,均采用批次数据训练的形式对模型参数进行更新,但是现有方法是采用批次数据对中心点距离目标函数的函数值进行近似的方式来确定各个类别的中心点距离,也就是说,在训练过程中计算出的中心点距离不准确,从而导致深度学习模型的分类准确率不高。

发明内容

本发明实施例的目的在于提供一种深度学习模型的训练方法、装置、电子设备及计算机可读存储介质,以提升深度学习模型的分类准确率。具体技术方案如下:

第一方面,本发明实施例提供了一种深度学习模型的训练方法,所述方法包括:

利用训练样本集中的各个样本,对预先构建的初始深度学习模型进行训练,得到中间深度学习模型;其中,所述初始深度学习模型为:加载有分类目标函数的深度学习模型;

利用所述中间深度学习模型,计算所述训练样本集中各个样本的特征向量,并根据所述训练样本集中各个样本的特征向量,计算中心点距离目标函数的中间参数的初始值;

将所述中心点距离目标函数添加到所述中间深度学习模型中并加载所述中间参数的初始值,得到目标深度学习模型;

导入所述训练样本集中的预设数量个样本作为批次数据;

利用当前目标深度学习模型,计算当前批次数据中各个样本的特征向量,并根据当前批次数据中各个样本的特征向量,更新所述中间参数的参数值;

基于当前批次数据中各个样本的特征向量,计算所述中心点距离目标函数的函数值和所述分类目标函数的函数值,并判断计算得到的中心点距离目标函数的函数值是否收敛到第一预定区间,且计算得到的分类目标函数的函数值是否收敛到第二预定区间;

如果否,利用所述中心点距离目标函数的反向传播梯度和所述分类目标函数的反向传播梯度,调整当前目标深度学习模型的参数,并返回执行所述导入所述训练样本集中的预设数量个样本作为批次数据的步骤;

如果是,结束对所述当前目标深度学习模型的训练。

可选的,所述中心点距离目标函数的中间参数包括:各个类别的中心点、每一类别中的各个样本与该类别的中心点的偏差和、每一类别中的各个样本与该类别的中心点的距离的平方和;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥麟图信息科技有限公司,未经合肥麟图信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810258256.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code