[发明专利]一种深度学习的训练方法有效

申请号：	202010221098.9	申请日：	2020-03-26
公开（公告）号：	CN111126576B	公开（公告）日：	2020-09-01
发明（设计）人：	代笃伟;赵威;申建虎;王博;张伟	申请（专利权）人：	北京精诊医疗科技有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	北京联瑞联丰知识产权代理事务所(普通合伙) 11411	代理人：	赵娜
地址：	102629 北京市大兴区中关村科技***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种深度学习训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种深度学习的训练方法，收集跨域的测试数据训练模型，并根据模型预测测试集的准确率，将有监督学习和伪标签学习有效的结合起来，较大的提升了网络的泛化能力，使用训练得到的模型来对跨域的未标注的数据进行预测，生成伪标签，辅助人工标注，提升了人工标注的效率。

技术领域

本发明涉及深度学习技术领域，特别是指一种深度学习的训练方法。

背景技术

大数据时代，每天都会产生巨量的数据，但是这些数据都是杂乱无章的，如果人工对这些数据进行总结和分析，不仅耗时耗力，而且结果很差。因此希望训练人工智能，让机器具有分析、总结甚至推理的能力，代替人类完成一些任务。

训练数据是深度学习中最重要的环节之一。标注训练数据需要大量的时间和人力，因此深度学习逐渐从有监督学习向伪标签、半监督学习、无监督学习发展。某些深度学习模型在特定的数据域上有良好的表现，换一个数据域后，准确率则大幅下降，因此出现了很多防止模型过拟合，提升模型泛化能力的策略。例如：使用有监督学习和无监督学习结合的学习策略、使用dropout策略，使用权重正则化策略等。

1、有监督学习：通俗的来讲，就是需要人工对数据进行标注。监督学习的训练集要求包括输入输出，也可以说是特征和目标。训练集中的目标是由人标注的。监督学习通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合，最优表示某个评价准则下是最佳的)，再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的。监督学习的目标往往是让计算机去学习已经创建好的分类系统(模型)。监督学习是训练神经网络和决策树的常见技术，这两种技术高度依赖事先确定的分类系统给出的信息。对于神经网络，分类系统利用信息判断网络的错误，然后不断调整网络参数。对于决策树，分类系统用它来判断哪些属性提供了最多的信息。

2、无监督学习：数据是没有标签的或者是有一样的标签。不知道数据的含义和作用，让网络自己学习如何对数据进行分类。输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类(聚类)试图使类内差距最小化，类间差距最大化。通俗的讲，实际应用中，不少情况下无法预先知道样本的标签，也就是说没有训练样本对应的类别，因而只能从原先没有样本标签的样本集开始学习分类器设计。非监督学习目标不是告诉计算机怎么做，而是让计算机自己去学习怎样做。无监督学习的方法分为两大类：

1)基于概率密度函数估计的直接方法：找到各类别在特征空间的分布参数，再进行分类。

2)基于样本间相似性度量的简洁聚类方法：其原理是设法定出不同类别的核心初始内核，然后依据样本与核心之间的相似性度量将样本聚集成不同的类别。利用聚类结果，可以提取数据集中隐藏信息，对未知数据进行分类和预测。

3、伪标签：在标签数据上训练模型，然后使用经过训练的模型来预测无标签数据的标签，从而创建伪标签。此外，将标签数据和新生成的伪标签数据结合起来作为新的训练数据。

4、Dropout：dropout是训练深度神经网络的一种trick，在网络进行前向传播的时候，让某些神经元的激活值以一定的概率P停止工作。

5、正则化：通常神经网络可以模拟任何非线性函数，即通过增加隐含层的数量来无限接近目标值，然而，这样的情况下，难免也会把噪声进行拟合，为了避免过拟合，需要将权重正则化，权重正则化的含义就是保证权重系数在绝对值意义上足够小，使得噪声不会被较好地拟合。L2正则化就是在代价函数后面再加上一个正则化项，计算方式如下：

其中θ是网络层的待学习参数，λ是正则化系数，控制正则项的大小，较大的λ取值将较大程度约束模型复杂度。

综上所述，可知现有的训练策略训练的模型在训练数据域上表现良好，但是在跨域数据上表现急剧下降，标注数据需要大量的人工成本。

发明内容

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京精诊医疗科技有限公司，未经北京精诊医疗科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010221098.9/2.html，转载请声明来源钻瓜专利网。

上一篇：电路板安装模块、电子设备装配系统及方法
下一篇：一种基于5G物联网的医院楼宇防疫系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种深度学习的训练方法有效

专利文献下载