[发明专利]一种基于模型扩展卷积神经网络的图像分类方法及系统有效
申请号: | 202010768636.6 | 申请日: | 2020-08-03 |
公开(公告)号: | CN112132145B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 李岩山;陈嘉欢 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/77;G06V10/764;G06V10/80;G06V10/82;G06N3/0464 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 薛异荣 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 扩展 卷积 神经网络 图像 分类 方法 系统 | ||
1.一种基于模型扩展卷积神经网络的图像分类方法,其特征在于,包括如下步骤:
对待分类的图像进行预处理,将满足条件的图像对应的原图像作为网络的输入图像;
通过模型扩展和后卷积特征提取机制改进卷积网络,形成细节特征注意力模型对输入图像提取特征,得到图像特征,包括:
以恒定的比例均匀缩放模型改变传统的卷积网络的长度、宽度和分辨率,在预设资源约束下使模型的精度最大化,约束条件如以下公式:
其中,w,d,r分别为扩展网络的宽度,深度以及分辨率;以及是预先定义的基线网络的参数;
利用基线网络特征参数的加权平均值得到各自通道的权重因子,提取特征的过程中加入了池化层和全连接层,最终得到图像的特征,将不同通道的维度上的特征串接到一起,最终得到图像的特征图;
获取图像的信息量,通过聚类算法地划分出区域内置信度较高的特征图像信息量以及置信度较低的特征图像信息量,其中,置信度高特征图的判断依据为:
其中,H0为随机选取的图像信息量对应的二维坐标上的点,K的值为预设范围,其对应在二维坐标上为H0的半径,范围在K内的点对应的特征图后续通过较少扩展的网络,反之则经过较多扩展度的网络;
利用移动卷积层对每个输入通道进行滤波后计算输入通道的线性组合来创建新的图像特征,并对图像特征进行降维,得到包含信息量更多的图像特征向量图;
基于图像特征向量图对图像进行分类判断得到分类结果,并基于预设后端决策融合算法,通过后端决策融合得到最高置信度的分类结果作为最终的分类结果,包括:
子图判断分类的过程通道网络由Softmax层输出的后验概率计算公式如下:
其中,p表示分类类别,Vp和Vj分别表示该类别的置信度以及某一类别的置信度,通过以下公式推导子图的分类结果:
probmax(i)=max{prob(1),prob(2)...prob(M)}
子图的分类结果会被加入候选区,第i个子图得到的特征系数为mi,则在候选区中,分类的结果Z={Z1,Z2...ZM}原图像该类别的得分表示为:
其中,k表示分类结果对应的结果标号,N表示通过像素阈值判断法子图的个数;
结合所有有效子图的判断类别,得到决策融合分类结果,通过以下公式计算:
Zlast=max{fra(Z1),fra(Z2)...fra(ZM)}。
2.根据权利要求1所述的基于模型扩展卷积神经网络的图像分类方法,其特征在于,所述对待分类的图像进行预处理,将满足条件的图像对应的原图像作为网络的输入图像,包括:
将待分类的图像进行图像分割得到多个子图,并剔除信息量较少的子图,将有代表意义的子图进行旋转,镜像和对比度调节,增强图像特征后得到输入图像,其中,分割的子图为Si,通过以下公式得到其灰度像素值图像:
其中R(x,y),G(x,y),B(x,y)分别表示子图中三个通道的像素值的均值,根据图像的平均像素灰度值计算得到;
将满足预设条件的图像对应的原图像作为网络的输入图像,预设条件如以下公式:
num(Sgray(xj,yj))K
其中,预设灰度值数值的阈值为P,图像像素数目的阈值为K,n为图像像素的尺寸大小。
3.根据权利要求1所述的基于模型扩展卷积神经网络的图像分类方法,其特征在于,图像的信息量H通过以下公式计算:
其中,各个通道某个像素值的大小为Pi,各通道出现的像素值概率分别为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010768636.6/1.html,转载请声明来源钻瓜专利网。