[发明专利]深度学习模型的建立方法、样本处理方法及装置在审
申请号: | 202010438330.4 | 申请日: | 2020-05-21 |
公开(公告)号: | CN111814821A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 王泽荣 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王婷婷 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 模型 建立 方法 样本 处理 装置 | ||
本发明提供了一种深度学习模型的建立方法、样本处理方法及装置,通过深度学习模型,获取训练集中训练样本的第一样本特征,以及验证集中验证样本的第二样本特征;对第一样本特征进行归一化处理得到第一分布特征,以及对第二样本特征进行归一化处理得到第二分布特征;根据第一分布特征与第二分布特征之间的距离值,确定权重值;获取训练集的损失函数,并通过权重值对损失函数进行加权处理,得到目标损失函数;通过目标损失函数对深度学习模型进行训练,得到目标深度学习模型。本发明可以通过不同训练集对应的权重值,优化不同训练集的训练样本对模型参数造成的影响,从而降低了通过训练集训练得到的深度学习模型在验证集中出现性能下降的几率。
技术领域
本发明属于计算机技术领域,特别是涉及一种深度学习模型的建立方法、样本处理方法及装置。
背景技术
深度学习模型源于对人工神经网络的研究,关于深度学习模型的模型训练过程,需要利用训练集和验证集中的数据,以获取模型较高精度的参数。
在目前,深度学习模型的训练过程,通常是从开源数据库中支架获取训练集和验证集,对训练集和验证集的内容不做过多关注,并将训练集中的数据输入深度学习模型,根据深度学习模型的输出值以及相应的损失函数,计算得出模型的参数,之后,可以将验证集中的数据输入在该参数作用下深度学习模型,并根据深度学习模型的输出,确定模型的性能优劣。
但是,目前的模型训练方法,对训练集和验证集的内容本身不作过多关注,往往会由于训练集和验证集的数据类别或采集场景不同的原因,产生通过训练集训练得到的深度学习模型,在验证集上产生性能下降的问题,从而降低了模型的训练精度。
发明内容
本发明提供一种深度学习模型的建立方法、样本处理方法及装置,以便解决现有技术中由于训练集和验证集的数据类别或采集场景不同的原因,产生的通过训练集训练得到的深度学习模型,在验证集上产生性能下降的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种深度学习模型的建立方法,该方法可以包括:
通过深度学习模型,获取训练集中训练样本的第一样本特征,以及验证集中验证样本的第二样本特征;
对所述第一样本特征进行归一化处理得到第一分布特征,以及对所述第二样本特征进行归一化处理得到第二分布特征;
计算所述第一分布特征与所述第二分布特征之间的距离值,并根据所述距离值,确定权重值;
获取所述训练集的损失函数,并通过所述权重值对所述损失函数进行加权处理,得到目标损失函数;
通过所述目标损失函数对所述深度学习模型进行训练,得到目标深度学习模型。
第二方面,本发明实施例提供了一种样本处理方法,该方法可以包括:
获取待处理样本;
将所述待处理样本输入目标深度学习模型进行处理,输出针对所述待处理样本的处理结果;
其中,所述目标深度学习模型是根据深度学习模型的建立方法所得到的。
第三方面,本发明实施例提供了一种深度学习模型的建立装置,该深度学习模型的建立装置可以包括:
获取模块,用于通过深度学习模型,获取训练集中训练样本的第一样本特征,以及验证集中验证样本的第二样本特征;
归一处理模块,用于对所述第一样本特征进行归一化处理得到第一分布特征,以及对所述第二样本特征进行归一化处理得到第二分布特征;
权重模块,用于计算所述第一分布特征与所述第二分布特征之间的距离值,并根据所述距离值,确定权重值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010438330.4/2.html,转载请声明来源钻瓜专利网。