[发明专利]基于深度课程学习的图像识别方法、装置及设备在审
申请号: | 202011466828.8 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112465064A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 洪日昌;胡珍珍;秦伟;刘学亮;汪萌 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06N3/04;G06N3/08;G06T7/194 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 周新楣 |
地址: | 230009 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 课程 学习 图像 识别 方法 装置 设备 | ||
1.一种基于深度课程学习的图像识别方法,其特征在于,具体步骤包括如下:
获取数据步骤,通过显著性检测模型将第一图像分离成前景图像和背景图像;构建模型步骤,将单分支的卷积神经网络转换成双输入分支和融合层的卷积神经网络;
训练步骤,将所述前景图像和所述背景图像输入所述卷积神经网络,根据所述卷积神经网络输出概率结果和所述前景图像的标签,使用交叉熵计算真实类别标签和预测的概率之间的损失距离,得到最优卷积神经网络;
识别步骤,将待识别的图像输入最优卷积神经网络中,输出识别结果。
2.根据权利要求1所述的一种基于深度课程学习的图像识别方法,其特征在于,所述构建模型步骤中,将单分支的卷积神经网络转换成双输入分支和融合层的卷积神经网络;
底层的卷积运算单元被复制成两份,分别处理背景图像和前景图像;所述背景图像和所述前景图像的视觉特征按位相加,再输入到后面的卷积运算单元和全连接分类器中;双输入分支部分的底层卷积运算单元加载预训练的底层参数,并在训练中保持不变;两个分支部分的前两个res-block是加载预训练参数并固定的。
3.根据权利要求1所述的一种基于深度课程学习的图像识别方法,其特征在于,所述训练步骤中,在每个训练轮次中,将所述第一图像的前景图像和第二图像对应背景图像匹配;作为一个新的样本输入给所述卷积神经网络,并根据预测概率和所述第一图像的前景图像的真实类别标签,通过交叉熵计算损失距离;
累加计算真实类别标签和预测的概率之间的两个损失距离,作为第一图像的最终损失距离。
4.根据权利要求3所述的一种基于深度课程学习的图像识别方法,其特征在于,所述第二图像为包含第一图像的真实类别标签的图像。
5.根据权利要求3所述的一种基于深度课程学习的图像识别方法,其特征在于,利用反向传播算法,根据计算出的最终损失距离计算所述卷积神经网络中参数更新的梯度,根据所述梯度更新所述卷积神经网络的权重参数。
6.根据权利要求5所述的一种基于深度课程学习的图像识别方法,其特征在于,所述梯度的更新函数表达式为:
Lj=Lce(f(xI,cj),yI)+Lce(f(xI,cI),yI);
其中,xI代表该样本对于的前景图像,cj代表第二图像的背景图像,cI代表第一图像的背景图像;yI代表第一图像的真实类别标签;Lce代表交叉熵损失函数。
7.一种基于深度课程学习的图像识别装置,其特征在于,包括:
第一获取模块,通过显著性检测模型将第一图像分离成前景图像和背景图像;其中,所述第一图像中带有真实类别标签;
第一输入模块,用于将所述前景图像和所述背景图像输入卷积神经网络,根据所述卷积神经网络输出概率结果和所述前景图像的标签,使用交叉熵计算真实类别标签和预测的概率之间的损失距离,得到最优卷积神经网络;
第一处理模块,将待识别的图像输入最优卷积神经网络中,进行图像的处理;
第一输出模块,根据所述第一处理模块的处理结果,输出图像识别结果。
8.根据权利要求7所述的一种基于深度课程学习的图像识别装置,其特征在于,还包括:损失距离计算模块,所述损失距离计算模块将所述第一图像的前景图像和第二图像对应背景图像匹配;作为一个新的样本通过所述第一输入模块输入给所述卷积神经网络,并根据预测概率和所述第一图像的前景图像的真实类别标签,通过交叉熵计算损失距离;
累加计算真实类别标签和预测的概率之间的两个损失距离,作为第一图像的最终损失距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011466828.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电话业务处理方法、装置、电子设备及存储介质
- 下一篇:一种可折叠无人机