[发明专利]深度学习模型训练方法及装置有效
申请号: | 202010247381.9 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111461345B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 李兴建;熊昊一;安昊哲 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/098 | 分类号: | G06N3/098;G06F18/24;G06F18/22;G06V10/82;G06V10/74;G06V10/764 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 模型 训练 方法 装置 | ||
1.一种深度学习模型训练方法,所述方法应用于服务器,其特征在于,包括:
接收终端设备发送的训练请求,所述训练请求用于请求训练人工智能深度学习模型;
根据所述训练请求,利用数据集中的样本对深度学习模型进行m轮训练,其中,所述m轮训练中任意相邻的两轮训练中,后一轮训练的输入是利用前一轮训练的训练结果对所述数据集中各样本的软化标签进行更新得到的,所述m≥2且为整数;
所述深度学习模型为图片分类模型,所述深度学习模型用于图片分类,所述数据集中包括多类图片样本,每一类图片包括至少一张图片,所述m轮训练包括第x-1轮训练和第x轮训练,所述根据所述训练请求,利用数据集中的样本对深度学习模型进行m轮训练,包括:
利用第x-1轮训练得到第x-1轮深度学习模型后,利用所述第x-1轮模型对所述数据集中各类图片样本的软化标签进行更新,得到第x-1数据集,第x-1数据集中的任意一类样本的软化标签用于表征对应类图片样本和所述第x-1数据集中其他类样本的相似度,2≤x≤m且为整数;
将所述第x-1数据集作为所述第x轮训练的输入,以执行第x轮训练;
所述根据所述训练请求,利用数据集中的样本对深度学习模型进行m轮训练,包括:
对于所述m轮中的第x轮训练,将所述第x-1数据集中的样本输入至所述第x-1轮深度学习模型以训练得到第x轮深度学习模型;
利用所述深度学习模型对应的损失函数判断是否完成所述第x轮深度学习模型的训练。
2.根据权利要求1所述的方法,其特征在于,所述根据所述训练请求,利用数据集中的样本对深度学习模型进行m轮训练,包括:
执行所述m轮中的第x-1轮训练之前,判断所述数据集中每一类样本的软化标签的平均值,以得到各类样本的软化标签;
根据各类样本的软化标签,确定至少两类样本中第一类样本的软化标签和第二类样本的软化标签,所述第一类样本和所述第二类样本是同一种类的不同子类;
根据所述第一类样本的软化标签和所述第二类样本的软化标签,确定是否停止所述深度学习模型训练。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一类样本的软化标签和所述第二类样本的软化标签,确定是否停止所述深度学习模型训练,包括:
确定所述第一类样本的软化标签和所述第二类样本的软化标签之间的距离是否小于预设阈值,若所述距离小于所述预设阈值,则确定停止所述深度学习模型训练。
4.根据权利要求1-3任一项所述的方法,其特征在于,对于所述m轮中的第x轮训练,将所述第x-1数据集中的样本输入至所述第x-1轮深度学习模型以训练得到第x轮深度学习模型之前,还包括:
确定所述第x-1数据集中的同一类别的样本的软化标签的平均值,将所述平均值作为所述第x-1数据集中的同一类别的各样本的软化标签。
5.根据权利要求1-3任一项所述的方法,其特征在于,
当x=2时,所述数据集中各样本的软化标签是利用对应样本的独热码得到的。
6.根据权利要求1~3任一项所述的方法,其特征在于,所述根据所述训练请求,利用数据集中的样本对深度学习模型进行m轮训练之后,还包括:
输出经过m轮训练的深度学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010247381.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息查询方法和装置
- 下一篇:策略的评估方法、装置和设备