[发明专利]图片分类方法、装置、计算机设备和存储介质在审
申请号: | 201911391376.9 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111159450A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 周康明;谈咏东 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 樊倩 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 分类 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种图片分类方法、装置、计算机设备和存储介质,使用的分类神经网络是基于初始神经网络训练的,且该初始神经网络的多个并联全连接层可输出不同属性类别数量,这样在训练初始神经网络时,训练全连接层时初始神经网络的特征提取层会学习图片中的参数特征,当训练初始神经网络中的不同的全连接层是,可进一步促进初始神经网络的特征提取层学习图片中的参数特征,相当于,对于多属性分类问题,通过在初始神经网络上设置多个并联全连接层,使得该神经网络对图片中的参数特征学习的更加精确,这样在使用训练好的分类神经网络对图片的属性进行分类时,得到的分类结果也更加精确。
技术领域
本申请涉及图片处理技术领域,特别是涉及一种图片分类方法、装置、计算机设备和存储介质。
背景技术
随着深度卷积神经网络在图片分类上的应用越来越广泛,单一属性的图片多分类越来越不能满足实际需求。
目前,有许多多属性分类的例子,比如一部电影可以同时划分为动作片和科幻片、一张照片可同时划分为风景照和植物照等。通常,复杂的多属性分类,由于每类属性之间划分界限不一样,使得属性和属性之间存在一定关联,这样在训练深度卷积神经网络时,每类属性的界限划分不够精确,以至于训练的模型的不够收敛,也不能准确的识别出图片的每一类属性。
发明内容
基于此,有必要针对上述的技术问题,提供一种图片分类方法、装置、计算机设备和存储介质。
第一方面,本申请实施例提供一种图片分类方法,该方法包括:
获取多张多属性图片;
将各图片输入至预设的分类神经网络中,得到多种属性分类结果;
其中,分类神经网络是基于初始分类神经网络训练的,初始神经网络包括多个并联的全连接层,多个并联的全连接层共用一个输入层和特征提取层,每个全连接层输出的属性类别数量不同。
在其中一个实施例中,上述分类神经网络的训练过程包括:
获取多张样本多属性图片;
将各样本多属性图片输入至输入层和特征提取层后,依照全连接层输出的属性类别数量从小到大,且前一个全连接层收敛后再训练下一个全连接的顺序,依次单独训练每个全连接层,直到所有的全连接层都收敛,注释掉除输出属性类别数量最大的全连接层以外的其它全部全连接层,得到分类神经网络。
在其中一个实施例中,若初始神经网络的全连接层包括第一全连接层、第二全连接层和第三全连接层;第一全连接层输出的属性类别数量第二全连接层输出的属性类别数量第三全连接层输出的属性类别数量;
则上述分类神经网络的训练过程包括:
将各样本多属性图片输入至输入层和特征提取层后,训练第一全连接层,在第一全连接层收敛后训练第二全连接层,在第二全连接层收敛后训练第三全连接层,在第三全连接层收敛后,注释掉第一全连接层和第二全连接层,得到分类神经网络。
在其中一个实施例中,上述初始分类神经网络还包括多个分类函数层,分类函数层分别连接在对应的全连接层后面;
分类函数层,用于在训练过程中,将各全连接层的输出变换为预设区间的值,并根据预设区间的值与预设阈值的比较结果,确定各全连接层对应的分类结果,再基于标准分类结果预测各所述分类结果的准确率。
在其中一个实施例中,上述各全连接层的损失函数存在关联关系;
关联关系至少包括:按照全连接层的属性分类数量从小到大的顺序,从第二个全连接层开始,每一个全连接层的综合损失函数为当前全连接层的层级损失函数与当前全连接层之前的所有全连接层的层级损失函数的加权和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911391376.9/2.html,转载请声明来源钻瓜专利网。