[发明专利]一种基于ViT网络的图像成像设备识别方法在审
申请号: | 202210408143.0 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114898080A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 刘圆圆;陈冲;彭宇航;李竹;林宏伟;陆康;杨家玉 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V10/14 | 分类号: | G06V10/14;G06V10/82;G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 王金林 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 vit 网络 图像 成像 设备 识别 方法 | ||
1.一种基于ViT网络的图像成像设备识别方法,其特征在于,至少包括以下步骤:
预先训练得到图像成像设备识别模型;
将待识别图像输入图像成像设备识别模型并输出识别结果,以得到该图像的成像设备类型;
其中,图像成像设备识别模型的训练包括以下步骤:
步骤S10:通过相机拍摄标准校色板和不包含校色板的标准图像;
步骤S20:根据校色板真值和拍摄的校色板数据,使用色彩校正矩阵计算公式得出色彩校正矩阵VCCM;
步骤S30:将VCCM作为ViT网络的学习目标设计网络中的L1Loss;
步骤S40:将不包含校色板的标准图像作为输入训练ViT网络,通过反向传播不断更新网络参数;
步骤S50:在训练好的ViT网络后端连接KNN,将待识别图像送入ViT网络,最终得出该图像的设备型号识别结果。
2.根据权利要求1所述的基于ViT网络的图像成像设备识别方法,其特征在于,步骤S40中,使用了L1Loss进行了网络提取的色彩校正特征和S20中计算的色彩校正矩阵特征的L1距离计算,并通过反向传播反馈给网络,进而不断更新网络参数,其中L1Loss计算公式如下:
其中,yi是目标值,f(xi)是模型输入图像x后得到的估计值,对两者做绝对值差值取均值得到损失。
3.根据权利要求1所述的基于ViT网络的图像成像设备识别方法,其特征在于,在步骤S40中,网络训练特征提取过程中,使用了自注意力机制的特征提取,包括以下步骤:
S401:当一张新的训练图像X∈RH×W×C送入进ViT网络中,首先使用一个尺度和步长P的卷积核将图片信息重塑扁平化为二维碎片序列其中HW是原始图像的分辨率,C是通道数,P是每个图像碎片的分辨率;N=HW/P2是产生的碎片数;
S402:在embedding中将拉平后的二维碎片经过线性投影成一维数据,得到N个展开的一维图片向量;同时添加一个可学习的类别块,这个类别块将用于与所有的图像小块进行交互,最终从类别块中学习到用于分类的特征;并且对以上的输入特征加入位置编码信息,位置编码用于标示每一个图像块的相对位置;
S403:将图像块输入到transformer中进行自注意力的特征提取,其中,自注意力特征提取的计算过程如下:
首先将步骤S402中的图像块转化为嵌入向量,将图像块看成是键值对序列,得到K=(k1,k2,…,kN),V=(v1,v2,…,vN),Q=(q1,q2,…,qM)三个向量,Q表示查询序列,K和V分别表示键序列和值序列,使用下面公式计算查询qt和每个ki注意力的得分eti,得分eti的计算公式为:
使用softmax等函数对注意力得分做归一化处理,得到每个键的权重wti,每个键的权重wti的计算公式为:
将权重wti和其对应的值vi加权求和作为注意力特征输出,注意力特征的计算公式为:
Attention(qt,K,V)=∑iwtivi。
4.根据权利要求1所述的基于ViT网络的图像成像设备识别方法,其特征在于,步骤S50中,当型号待识别图像送入训练好的ViT网络中,得到该图像的色彩校正向量,使用KNN对该色彩校正特征进行分类,最终得出相机设备型号预测类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210408143.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种触控屏和电子设备
- 下一篇:在硬件中执行核心跨越
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序