[发明专利]基于Cot-cirConvNeXt网络的图像分类方法在审
申请号: | 202310518193.9 | 申请日: | 2023-05-09 |
公开(公告)号: | CN116664917A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 陈昱莅;陈国萍;陆铖;白佳洋 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cot circonvnext 网络 图像 分类 方法 | ||
1.一种基于Cot-cirConvNeXt网络的图像分类方法,其特征在于由下述步骤组成:
(1)数据集预处理
取全视野数字切片1000张,截取出有标注的图像区域,切割成224×224像素的图像块,按8:1:1的比例划分为训练集、验证集、测试集;
(2)构建Cot-cirConvNeXt网络
Cot-cirConvNeXt网络由第一特征构建模块、第二特征构建模块、第三特征构建模块、第四特征构建模块、全连接层依次串联构成;
所述第一特征构建模块由卷积核大小为4×4步长为4的卷积层与归一化层、3个注意力卷积模块依次串联构成;第二特征构建模块由下采样层与3个注意力卷积模块依次串联构成;第三特征构建模块由下采样层与9个感知卷积模块依次串联构成;第四特征构建模块由下采样层与3个感知卷积模块依次串联构成;
(3)训练Cot-cirConvNeXt网络
1)确定目标函数
目标函数包括损失函数L、评价函数ACC、评价函数F1,按下式确定损失函数L:
L=-[y log pi+(1-y)log(1-pi)]
其中,y表示目标类或非目标类,目标类y取值为0,非目标类y取值为1,pi为模型对第i个类别的预测概率,zi表示模型对第i个类别的预测得分,zc表示模型对第c个类别的预测得分;
按下式确定评价函数ACC:
其中,TP表示正例预测正确的个数,FP表示负例预测错误的个数,TN表示负例预测正确的个数,FN表示正例预测错误的个数,TP与FP、TN、FN的和为总的样本数,TP与TN的和为预测正确的样本数,TP,FP,TN,FN∈N,N为有限的正整数,且TP,FP,TN,FN不同时为0;
按下式确定评价函数F1:
其中,P是精准率,R是召回率,且TP,FP,TN,FN不同时为0;
2)训练Cot-cirConvNeXt网络
将训练集送入到Cot-cirConvNeXt网络中进行训练,在训练过程中,Cot-cirConvNeXt网络的学习率为γ∈[10-5,10-3],优化器采用AdamW优化方法,迭代至损失函数收敛;
(4)保存模型
在训练Cot-cirConvNeXt网络过程中,不断更新权重,保存权重文件;
(5)验证Cot-cirConvNeXt网络
将验证集输入到Cot-cirConvNeXt网络中进行验证;
(6)测试Cot-cirConvNeXt网络
将测试集输入到Cot-cirConvNeXt网络中进行测试,加载保存的权重文件,得到图像的分类。
2.根据权利要求1所述的基于Cot-cirConvNeXt网络的图像分类方法,其特征在于:在步骤(2)构建Cot-cirConvNeXt网络中,所述的注意力卷积模块由深度可分离卷积层与归一化层1、卷积核大小为1×1步长为1的卷积层1、激活函数层1、卷积核大小为1×1步长为1的卷积层2、归一化层2、正则化层1、上下文注意力模块1依次串联构成;所述的深度可分离卷积层由逐通道卷积层与卷积核大小为1x1步长为1的逐点卷积层串联构成组成,逐通道卷积层的卷积核大小为7x7、步长为1、填充数目为3、分组数为当前通道数;所述的第二特征构建模块的注意力卷积模块与第一特征构建模块的注意力卷积模块的结构相同。
3.根据权利要求2所述的基于Cot-cirConvNeXt网络的图像分类方法,其特征在于:所述的上下文注意力模块1的卷积核大小为3、步长为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310518193.9/1.html,转载请声明来源钻瓜专利网。