[发明专利]深度学习模型的模型训练方法、装置、设备及存储介质在审
申请号: | 202210107268.X | 申请日: | 2022-01-28 |
公开(公告)号: | CN114492649A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 黄永锋 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F11/36 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 李木燕 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 模型 训练 方法 装置 设备 存储 介质 | ||
本申请适用于人工智能技术领域,提供了一种深度学习模型的模型训练方法、装置、设备及存储介质,包括:在模型训练阶段,采用训练数据对第一浮点型深度学习模型进行预训练,获得预训练后的第二浮点型深度学习模型,并将第二浮点型深度学习模型转换为整数型深度学习模型;在模型测试阶段,采用测试数据对整数型深度学习模型进行模型测试,根据测试结果判断整数型深度学习模型是否满足模型收敛状态条件;若满足,将整数型深度学习模型部署到嵌入式系统中使用,否则,返回模型训练阶段,采用训练数据对第二浮点型深度学习模型进行下一轮的预训练,直至获得满足模型收敛状态条件的整数型深度学习模型为止。该方法可以提高模型训练的准确率。
技术领域
本申请属于人工智能设备技术领域,尤其涉及一种深度学习模型的模型训练方法、装置、设备及存储介质。
背景技术
随着人工智能技术的发展,深度学习模型广泛应用于需要进行智能识别、智能决策的系统中,例如图像识别、音频识别等等。现有技术中,一般嵌入式系统的深度学习方案通常为先在PC(全称Personal Computer,个人计算机)端基于浮点型数据存储格式将深度学习模型预训练至收敛状态,再将该训练好的深度学习模型有浮点型转换成整数型,进而将整数型的深度学习模型部署到该嵌入式系统中进行使用。然而,由于深度学习模型由浮点型转换成整数型的过程中存在较大的精度损失,使得深度学习模型转换前后的识别或决策输出结果存在较大偏差,甚至出现输出结果反转的情况,会导致嵌入式系统在使用该深度学习模型时严重影响系统处理数据的准确性。
发明内容
有鉴于此,本申请实施例提供了一种深度学习模型的模型训练方法、装置、设备及存储介质,可以提高深度学习模型训练的准确率,避免嵌入式系统在部署深度学习模型时由于模型转换而造成精度损失。
本申请实施例的第一方面提供了一种深度学习模型的模型训练方法,所述深度学习模型的模型训练方法包括:
在模型训练阶段,采用训练数据对第一浮点型深度学习模型进行预训练,获得预训练后的第二浮点型深度学习模型,并将所述第二浮点型深度学习模型转换为整数型深度学习模型;
在模型测试阶段,采用测试数据对所述整数型深度学习模型进行模型测试,根据测试结果判断所述整数型深度学习模型是否满足模型收敛状态条件;
若满足模型收敛状态条件,将所述整数型深度学习模型部署到嵌入式系统中使用,否则,返回所述模型训练阶段,采用训练数据对所述第二浮点型深度学习模型进行下一轮的预训练,直至获得满足模型收敛状态条件的整数型深度学习模型为止。
结合第一方面,在第一方面的第一种可能实现方式中,所述在模型测试阶段,采用测试数据对所述整数型深度学习模型进行模型测试,根据测试结果判断所述整数型深度学习模型是否满足模型收敛状态条件的步骤,包括:
将目标测试数据输入至所述整数型深度学习模型中进行模型测试,以使所述整数型深度学习模型基于所述目标测试数据进行数据处理并输出对应的实际处理结果;
将所述实际处理结果与基于所述目标测试数据预设的期望处理结果进行相似度比对,计算出所述实际处理结果与所述期望处理结果之间的相似度值,将所述相似度值作为模型测试的测试结果;
根据所述测试结果,将所述相似度值与预设的相似度阈值进行大小比较,若所述相似度值大于所述预设的相似度阈值,则判断所述整数型深度学习模型满足模型收敛状态条件。
结合第一方面,在第一方面的第二种可能实现方式中,所述将所述测试数据输入至所述整数型深度学习模型中进行模型测试,以使所述整数型深度学习模型基于所述测试数据进行数据处理并输出对应的实际处理结果的步骤之前,包括:
构建用于对所述整数型深度学习模型进行模型测试的测试样本,其中,所述测试样本中包含有测试数据以及基于测试数据预设的期望处理结果,并在所述测试数据与所述基于测试数据预设的期望处理结果之间建立有相关对应的映射关联关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210107268.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种嵌合抗原受体及其应用
- 下一篇:一种墙面空鼓裂缝修补装置