[发明专利]模型训练方法、装置和电子设备有效
申请号: | 202110593535.4 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113361575B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 李建伟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 | ||
1.一种模型训练方法,包括:
获取训练样本;
利用所述训练样本训练模型,对所述模型的模型参数进行更新;
在每次训练的过程中,响应于所述模型参数更新结束,对所述模型参数进行归一化处理。
2.根据权利要求1所述的方法,其中,所述对所述模型参数进行归一化处理,包括:
响应于本次参与训练的模型层数小于所述模型的实际层数,基于所述模型所有层的模型参数,确定所述模型对应的整体量化参数;
基于所述整体量化参数,对所述模型中的每层的模型参数进行归一化处理。
3.根据权利要求1所述的方法,其中,所述对所述模型参数进行归一化处理,包括:
响应于本次参与训练的模型层数等于所述模型的实际层数,基于所述模型的任一层的模型参数,确定所述任一层对应的单元量化参数;
基于所述单元量化参数,对所述任一层的模型参数进行归一化处理。
4.根据权利要求1所述的方法,其中,所述利用所述训练样本训练所述模型,包括:
获取所述模型的卷积核的实际尺寸;
根据所述实际尺寸和预设间隔尺寸,生成所述卷积核的候选训练尺寸;
利用所述训练样本训练所述模型,其中,所述模型的卷积核的尺寸为任一所述候选训练尺寸。
5.根据权利要求1-4任一项所述的方法,其中,所述模型包括多个子模型,至少两个子模型之间具有重合的模型参数。
6.根据权利要求5所述的方法,其中,所述利用所述训练样本训练所述模型,对所述模型的模型参数进行更新,包括:
利用所述训练样本训练所述子模型,对所述子模型的模型参数进行更新;
基于所述子模型的更新后的模型参数,对所述模型的其余子模型的模型参数进行更新。
7.一种模型训练装置,包括:
获取模块,用于获取训练样本;
更新模块,用于利用所述训练样本训练模型,对所述模型的模型参数进行更新;
归一化模块,用于在每次训练的过程中,响应于所述模型参数更新结束,对所述模型参数进行归一化处理。
8.根据权利要求7所述的装置,其中,所述归一化模块,具体用于:
响应于本次参与训练的模型层数小于所述模型的实际层数,基于所述模型所有层的模型参数,确定所述模型对应的整体量化参数;
基于所述整体量化参数,对所述模型中的每层的模型参数进行归一化处理。
9.根据权利要求7所述的装置,其中,所述归一化模块,具体用于:
响应于本次参与训练的模型层数等于所述模型的实际层数,基于所述模型的任一层的模型参数,确定所述任一层对应的单元量化参数;
基于所述单元量化参数,对所述任一层的模型参数进行归一化处理。
10.根据权利要求7所述的装置,其中,所述更新模块,具体用于:
获取所述模型的卷积核的实际尺寸;
根据所述实际尺寸和预设间隔尺寸,生成所述卷积核的候选训练尺寸;
利用所述训练样本训练所述模型,其中,所述模型的卷积核的尺寸为任一所述候选训练尺寸。
11.根据权利要求7-10任一项所述的装置,其中,所述模型包括多个子模型,至少两个子模型之间具有重合的模型参数。
12.根据权利要求11所述的装置,其中,所述更新模块,具体用于:
利用所述训练样本训练所述子模型,对所述子模型的模型参数进行更新;
基于所述子模型的更新后的模型参数,对所述模型的其余子模型的模型参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110593535.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种石膏板翻板机
- 下一篇:一种自动化双头缩管机