[发明专利]一种深度学习的训练方法有效

专利信息
申请号: 202010221098.9 申请日: 2020-03-26
公开(公告)号: CN111126576B 公开(公告)日: 2020-09-01
发明(设计)人: 代笃伟;赵威;申建虎;王博;张伟 申请(专利权)人: 北京精诊医疗科技有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 代理人: 赵娜
地址: 102629 北京市大兴区中关村科技*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 深度 学习 训练 方法
【说明书】:

发明公开了一种深度学习的训练方法,收集跨域的测试数据训练模型,并根据模型预测测试集的准确率,将有监督学习和伪标签学习有效的结合起来,较大的提升了网络的泛化能力,使用训练得到的模型来对跨域的未标注的数据进行预测,生成伪标签,辅助人工标注,提升了人工标注的效率。

技术领域

本发明涉及深度学习技术领域,特别是指一种深度学习的训练方法。

背景技术

大数据时代,每天都会产生巨量的数据,但是这些数据都是杂乱无章的,如果人工对这些数据进行总结和分析,不仅耗时耗力,而且结果很差。因此希望训练人工智能,让机器具有分析、总结甚至推理的能力,代替人类完成一些任务。

训练数据是深度学习中最重要的环节之一。标注训练数据需要大量的时间和人力,因此深度学习逐渐从有监督学习向伪标签、半监督学习、无监督学习发展。某些深度学习模型在特定的数据域上有良好的表现,换一个数据域后,准确率则大幅下降,因此出现了很多防止模型过拟合,提升模型泛化能力的策略。例如:使用有监督学习和无监督学习结合的学习策略、使用dropout策略,使用权重正则化策略等。

1、有监督学习:通俗的来讲,就是需要人工对数据进行标注。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。监督学习通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优表示某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的。监督学习的目标往往是让计算机去学习已经创建好的分类系统(模型)。监督学习是训练神经网络和决策树的常见技术,这两种技术高度依赖事先确定的分类系统给出的信息。对于神经网络,分类系统利用信息判断网络的错误,然后不断调整网络参数。对于决策树,分类系统用它来判断哪些属性提供了最多的信息。

2、无监督学习:数据是没有标签的或者是有一样的标签。不知道数据的含义和作用,让网络自己学习如何对数据进行分类。输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类)试图使类内差距最小化,类间差距最大化。通俗的讲,实际应用中,不少情况下无法预先知道样本的标签,也就是说没有训练样本对应的类别,因而只能从原先没有样本标签的样本集开始学习分类器设计。非监督学习目标不是告诉计算机怎么做,而是让计算机自己去学习怎样做。无监督学习的方法分为两大类:

1)基于概率密度函数估计的直接方法:找到各类别在特征空间的分布参数,再进行分类。

2)基于样本间相似性度量的简洁聚类方法:其原理是设法定出不同类别的核心初始内核,然后依据样本与核心之间的相似性度量将样本聚集成不同的类别。利用聚类结果,可以提取数据集中隐藏信息,对未知数据进行分类和预测。

3、伪标签:在标签数据上训练模型,然后使用经过训练的模型来预测无标签数据的标签,从而创建伪标签。此外,将标签数据和新生成的伪标签数据结合起来作为新的训练数据。

4、Dropout:dropout是训练深度神经网络的一种trick,在网络进行前向传播的时候,让某些神经元的激活值以一定的概率P停止工作。

5、正则化:通常神经网络可以模拟任何非线性函数,即通过增加隐含层的数量来无限接近目标值,然而,这样的情况下,难免也会把噪声进行拟合,为了避免过拟合,需要将权重正则化,权重正则化的含义就是保证权重系数在绝对值意义上足够小,使得噪声不会被较好地拟合。L2正则化就是在代价函数后面再加上一个正则化项,计算方式如下:

其中θ是网络层的待学习参数,λ是正则化系数,控制正则项的大小,较大的λ取值将较大程度约束模型复杂度。

综上所述,可知现有的训练策略训练的模型在训练数据域上表现良好,但是在跨域数据上表现急剧下降,标注数据需要大量的人工成本。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京精诊医疗科技有限公司,未经北京精诊医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010221098.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top