[发明专利]一种深度学习模型的训练方法及装置在审

申请号：	201810258256.0	申请日：	2018-03-27
公开（公告）号：	CN108734193A	公开（公告）日：	2018-11-02
发明（设计）人：	李诚;周晓;朱才志	申请（专利权）人：	合肥麟图信息科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N99/00
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	马敬;项京
地址：	230000 安徽省合肥市高新区***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	中间参数学习样本目标函数批次数据特征向量点距离分类准确率分类目标函数添加计算训练距离目标模型训练中心点加载更新应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种深度学习模型的训练方法及装置，方法为：首先训练得到中间深度学习模型；计算训练样本集中各个样本的特征向量以及计算中心点距离目标函数的中间参数的初始值；将中心点距离目标函数添加到中间深度学习模型中并加载中间参数的初始值，得到目标深度学习模型；利用当前目标深度学习模型，计算当前批次数据中各个样本的特征向量，并更新中间参数的参数值；计算中心点距离目标函数的函数值和分类目标函数的函数值，并判断是否符合结束训练的条件；如果否，调整当前目标深度学习模型的参数，导入下一批次数据并进行模型训练；如果是，结束训练。应用本发明实施例提供的方案可以提升深度学习模型的分类准确率。

技术领域

本发明涉及机器学习技术领域，特别是涉及一种深度学习模型的训练方法及装置。

背景技术

包含分类目标函数的深度学习模型，即带有分类任务的深度学习模型(深度学习分类模型)，其通用架构是：首先采用若干组“卷积-非线性激励-池化”模块提取出数据分布的特征，然后采用“全连接”或者“1×1卷积”将特征缩减到指定数量个类别，最后通过softmax等分类目标函数实现类别分值的推断。而将包含分类目标函数的深度学习模型与中心点距离目标函数相结合，能够使得深度学习模型学习到的数据分布更加紧凑。

对于包含分类目标函数的深度学习模型，根据每一类别所包含的各个样本的特征向量可以计算得到该类别的中心点，该类别中各个样本到该类别的中心点的距离为中心点距离。在深度学习模型的训练过程中，可以通过减小中心点距离，来提升深度学习模型的分类准确率。

目前，在深度学习模型的训练过程中，均采用批次数据训练的形式对模型参数进行更新，但是现有方法是采用批次数据对中心点距离目标函数的函数值进行近似的方式来确定各个类别的中心点距离，也就是说，在训练过程中计算出的中心点距离不准确，从而导致深度学习模型的分类准确率不高。

发明内容

本发明实施例的目的在于提供一种深度学习模型的训练方法、装置、电子设备及计算机可读存储介质，以提升深度学习模型的分类准确率。具体技术方案如下：

第一方面，本发明实施例提供了一种深度学习模型的训练方法，所述方法包括：

利用训练样本集中的各个样本，对预先构建的初始深度学习模型进行训练，得到中间深度学习模型；其中，所述初始深度学习模型为：加载有分类目标函数的深度学习模型；

利用所述中间深度学习模型，计算所述训练样本集中各个样本的特征向量，并根据所述训练样本集中各个样本的特征向量，计算中心点距离目标函数的中间参数的初始值；

将所述中心点距离目标函数添加到所述中间深度学习模型中并加载所述中间参数的初始值，得到目标深度学习模型；

导入所述训练样本集中的预设数量个样本作为批次数据；

利用当前目标深度学习模型，计算当前批次数据中各个样本的特征向量，并根据当前批次数据中各个样本的特征向量，更新所述中间参数的参数值；

基于当前批次数据中各个样本的特征向量，计算所述中心点距离目标函数的函数值和所述分类目标函数的函数值，并判断计算得到的中心点距离目标函数的函数值是否收敛到第一预定区间，且计算得到的分类目标函数的函数值是否收敛到第二预定区间；

如果否，利用所述中心点距离目标函数的反向传播梯度和所述分类目标函数的反向传播梯度，调整当前目标深度学习模型的参数，并返回执行所述导入所述训练样本集中的预设数量个样本作为批次数据的步骤；

如果是，结束对所述当前目标深度学习模型的训练。

可选的，所述中心点距离目标函数的中间参数包括：各个类别的中心点、每一类别中的各个样本与该类别的中心点的偏差和、每一类别中的各个样本与该类别的中心点的距离的平方和；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于合肥麟图信息科技有限公司，未经合肥麟图信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810258256.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于投票机制的支持向量机机械故障诊断方法
下一篇：一种面向虚拟现实的基于单深度图的人体关节点识别方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种深度学习模型的训练方法及装置在审

专利文献下载