[发明专利]用于训练深度学习网络模型的方法、用于识别物品类别的方法、装置、电子设备在审
申请号: | 201911255846.9 | 申请日: | 2019-12-10 |
公开(公告)号: | CN112949351A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 吴贵英;姜大鹏;苏明月 | 申请(专利权)人: | 青岛海尔智能技术研发有限公司;海尔智家股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 张宇峰 |
地址: | 266101 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 深度 学习 网络 模型 方法 识别 物品 类别 装置 电子设备 | ||
1.一种用于训练深度学习网络模型的方法,其特征在于,包括:
建立初始网络模型;
利用预设物品图片数据集对所述初始网络模型进行多次迁移训练获得预设深度学习网络模型。
2.根据权利要求1所述的方法,其特征在于,所述利用预设物品图片数据集对所述初始网络模型进行多次迁移训练获得预设深度学习网络模型,包括:
将所述预设物品图片数据集按照与待识别物品图片的相似度划分为多个预设物品图片子数据集;
利用多个所述预设物品图片子数据集,按照预设迁移训练策略对所述初始网络模型进行训练;
将经过训练的初始网络模型作为所述预设深度学习网络模型。
3.根据权利要求2所述的方法,其特征在于,所述预设物品图片数据集中相似度小于预设相似度的物品图片为第一物品图片子数据集;和/或,
所述预设物品图片数据集中相似度大于或等于所述预设相似度的物品图片为第二物品图片子数据集。
4.根据权利要求3所述的方法,其特征在于,所述利用多个所述预设物品图片子数据集,按照预设迁移训练策略对所述初始网络模型进行训练,包括:
利用所述第一物品图片子数据集对所述初始网络模型进行初始训练并获得初始分类模型;
利用所述第二物品图片子数据集对所述初始分类模型进行二次训练并获得深度学习分类模型。
5.根据权利要求4所述的方法,其特征在于,所述利用多个所述预设物品图片子数据集,按照预设迁移训练策略对所述初始网络模型进行训练,还包括:
获得所述深度学习分类模型后,根据所述第一物品图片子数据集的第一数据和所述第二物品图片子数据集的第二数据的联合分布距离获得损失函数;
利用获得的损失函数对所述深度学习分类模型进行优化训练。
6.根据权利要求5所述的方法,其特征在于,所述损失函数通过以下公式计算获得:
其中,Loss为损失函数,ns为深度学习网络模型的层级数量,为交叉熵损失函数,α为联合分布差异的平衡参数,为第一数据和第二数据的联合分布距离,DS为第一数据经过卷积层L提取得到的特征,Dt为第二数据经过卷积层L提取得到的特征。
7.根据权利要求2至6任一项所述的方法,其特征在于,利用预设物品图片数据集对所述初始网络模型进行多次迁移训练获得预设深度学习网络模型,还包括:
对所述初始网络模型进行多次迁移训练前,对所述预设物品图片数据集中的物品图片进行增强操作。
8.一种用于识别物品类别的方法,其特征在于,包括:
获得待识别物品图片;
利用预设深度学习网络模型对所述待识别物品图片进行识别;
获得所述待识别物品图片中的物品的物品类别;
其中,所述预设深度学习网络模型是经过如权利要求1至7任一项所述的用于训练深度学习网络模型的方法训练获得的。
9.一种用于识别物品类别的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求8所述的用于识别物品类别的方法。
10.一种电子设备,其特征在于,包括如权利要求9所述的用于识别物品类别的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海尔智能技术研发有限公司;海尔智家股份有限公司,未经青岛海尔智能技术研发有限公司;海尔智家股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911255846.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种反应堆堆腔注水系统
- 下一篇:SFTP传输方法及装置