[发明专利]一种用于精细化识别车辆属性的深度神经网络及训练方法在审
申请号: | 201810194741.6 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108549926A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 林倞;周启贤;吴文熙;陈日全 | 申请(专利权)人: | 中山大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 广州容大益信专利代理事务所(普通合伙) 44397 | 代理人: | 牛丽霞;汪小梅 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 属性识别 车辆属性 神经网络 精细化 损失计算单元 连接层 迁移层 参数更新单元 多分类器 更新参数 任务迁移 随机梯度 损失函数 特征提取 特征向量 网络包括 优化算法 交叉熵 特征图 残差 回传 迁移 共享 网络 图片 | ||
1.一种用于精细化识别车辆属性的深度神经网络,包括:
深度残差网络,用于对输入的图片进行特征提取,得到特征图,所提取的特征供多个属性识别任务共享;
特征迁移层,包括多个特征迁移单元,用于针对各属性识别任务迁移共享的特征,使之更适应于特定的任务;
多个全连接层,对应各属性识别任务分支,连接于所述特征迁移层,以得到对应各属性识别任务的特征向量;
多个损失计算单元,对应各属性识别任务分支,分别连接各全连接层,用于使用交叉熵作为多分类器的损失函数计算损失,并于损失计算后,通过随机梯度下降优化算法回传损失,更新参数。
2.如权利要求1所述的一种用于精细化识别车辆属性的深度神经网络,其特征在于:所述深度神经网络还包括多个双线性池化单元,连接所述特征迁移层,用于使用双线性池化操作得到判别性更强的特征向量接入全连接层。
3.如权利要求1所述的一种用于精细化识别车辆属性的深度神经网络,其特征在于:对于车类型识别,视角识别,颜色识别类间差距比较大的识别任务,使用通用的深度网络图像分类算法,接入一个全连接层,输出一个一维的概率向量,长度为分类的类别数目。
4.如权利要求2所述的一种用于精细化识别车辆属性的深度神经网络,其特征在于:对于品牌/子品牌识别任务,使用压缩的双线性池化操作,输入一个特征图,输出一个判别性极强一维的特征向量,然后用一个全连接层将此特征向量转为长度为分类类别数的概率向量。
5.如权利要求1所述的一种用于精细化识别车辆属性的深度神经网络,其特征在于:每个特征迁移单元包括多个卷积层,每个卷积层采用卷积核,以迁移共享的特征,使之更适应于特定的任务。
6.如权利要求5所述的一种用于精细化识别车辆属性的深度神经网络,其特征在于:每个特征迁移单元包括两个卷积层,每个卷积层采用1*1卷积核。
7.一种用于精细化识别车辆属性的深度神经网络的训练方法,包括如下步骤:
步骤一,利用一数据集训练某一属性识别任务的分类分支以及共享的卷积层,得到判别性较好的预训练模型;
步骤二,利用该预训练模型,固定住共享的卷积层,利用不同的数据集用较大的学习率训练每个分支;
步骤三,将所有非一致数据集整合至一起变成一个大型混合数据集,并利用较小的学习率联合训练所有的识别任务,优化该神经网络的全部参数。
8.如权利要求7所述的一种用于精细化识别车辆属性的深度神经网络的训练方法,其特征在于:于步骤一中,利用该数据集训练子品牌分类分支以及共享的卷积层,得到判别性较好的预训练模型。
9.如权利要求7所述的一种用于精细化识别车辆属性的深度神经网络的训练方法,其特征在于:于步骤二中,利用其它不一致数据集训练颜色分类分支、车类型分类分支、视角分类分支以及品牌分支。
10.如权利要求7所述的一种用于精细化识别车辆属性的深度神经网络的训练方法,其特征在于:于步骤三中,对于缺省的属性用一个不参与计算损失的标签代替。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810194741.6/1.html,转载请声明来源钻瓜专利网。