[发明专利]图像识别模型的训练方法、装置、网络和图像识别方法在审
申请号: | 202210110008.8 | 申请日: | 2022-01-29 |
公开(公告)号: | CN114463559A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 申啸尘;周有喜 | 申请(专利权)人: | 新疆爱华盈通信息技术有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/774;G06K9/62;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 830000 新疆维吾尔自治区乌鲁木齐市经济技术开*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 模型 训练 方法 装置 网络 | ||
本申请涉及图像识别模型的训练方法、装置、网络和图像识别方法,该训练方法包括通过得到卷积神经网络对应的预测标签值,将卷积神经网络中多个中间层输出的特征图分别输入到各自对应的预设ViT网络进行特征提取,以得到各个预设ViT网络对应的预测标签值和第一预设损失函数值,然后分别对各个预设ViT网络进行权重和偏置更新,根据卷积神经网络对应的预测标签值和各个预设ViT网络对应的预测标签值计算得到整合后的预测标签值,根据整合后的预测标签值、卷积神经网络对应的第二预设损失函数和真实标签值计算得到卷积神经网络对应的第二预设损失函数值生成图像识别模型,能够将传统的卷积神经网络结构和ViT网络进行融合。
技术领域
本申请涉及图像识别领域,具体涉及一种图像识别模型的训练方法、装置、网络、图像识别方法和设备终端。
背景技术
目前,将ViT网络模型(Vision Transformer,视觉转换器)应用在计算机视觉上以替代CNN(Convolutional Neural Networks,卷积神经网络)是计算机视觉研究的热点,ViT网络模型本质上是利用视觉自注意力网络机制关注图片中各部分的重要信息,从而输出对应的预测结果。
由于上述方法较为新颖,使用到很多在卷积神经网络中不常用或出现频率较低的特殊算子,而此类特殊算子往往不能被移动端设备很好的支持,进而导致现有计算机视觉领域的有效方法往往无法直接与这种采用ViT网络模型的新型视觉方法进行结合。
发明内容
鉴于此,本申请提供一种图像识别模型的训练方法、装置、网络和设备终端,能够在利用传统的卷积神经网络结构的基础上,进一步结合ViT网络的优点,将传统的卷积神经网络结构和ViT网络进行融合,以克服现有计算机视觉领域的有效方法往往无法直接与这种采用ViT网络的新型视觉方法进行结合的缺点。
一种图像识别模型的训练方法,包括:
通过卷积神经网络对输入的训练图像数据集进行特征提取,以得到卷积神经网络对应的预测标签值;
获取卷积神经网络中多个中间层输出的特征图;
将各个中间层输出的特征图分别输入到各自对应的预设ViT网络进行特征提取,以得到各个预设ViT网络对应的预测标签值和第一预设损失函数值;
根据各自对应的第一预设损失函数值,分别对各个预设ViT网络进行权重和偏置更新;
根据卷积神经网络对应的预测标签值和各个预设ViT网络对应的预测标签值计算得到整合后的预测标签值;
根据整合后的预测标签值、卷积神经网络对应的第二预设损失函数和真实标签值计算得到卷积神经网络对应的第二预设损失函数值;
根据第二预设损失函数值对卷积神经网络进行权重和偏置更新;
循环执行上述步骤,直至第二预设损失函数收敛以生成对应的图像识别模型。
在一个实施例中,中间层为池化层,将各个中间层输出的特征图分别输入到各自对应的预设ViT网络进行特征提取,以得到各个预设ViT网络对应的预测标签值和第一预设损失函数值的步骤包括:
将多个池化层输出的特征图分别输入到各自对应的预设ViT网络进行特征提取,以获取各个预设ViT网络对应的预测标签值;
根据第一预设损失函数、各个预设ViT网络对应的预测标签值和真实标签值,计算得到各个预设ViT网络各自对应的第一预设损失函数值。
在一个实施例中,第二预设损失函数采用交叉熵损失函数,通过卷积神经网络对输入的训练图像数据集进行特征提取,以生成对应的预测标签值的步骤之前还包括:
基于交叉熵损失函数,将训练图像数据集输入到初始卷积神经网络进行训练,直至交叉熵损失函数收敛,得到训练收敛后的卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆爱华盈通信息技术有限公司,未经新疆爱华盈通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210110008.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序