[发明专利]一种基于卷积神经网络结构提取图像特征的方法在审
申请号: | 201910121702.8 | 申请日: | 2019-02-17 |
公开(公告)号: | CN109886331A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 王楷元;段迅达;其他发明人请求不公开姓名 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 太原市科瑞达专利代理有限公司 14101 | 代理人: | 卢茂春 |
地址: | 030024 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络结构 提取图像特征 网络提取 卷积 卷积神经网络 神经网络 图像特征 训练过程 网络 计算量 卷积核 弥散 降维 计算机 学习 | ||
1.一种基于卷积神经网络结构提取图像特征的方法,其特征是采用不同大小卷积核相结合,在提升网络深度的同时,对网络提取的特征进行降维。
2.根据权利要求1所述一种基于卷积神经网络结构提取图像特征的方法,其特征是所述网络结构包括19个3×3的卷积层和5个最大池化层组成的11个残差块结构。
3.根据权利要求1所述一种基于卷积神经网络结构提取图像特征的方法,其特征是所述卷积核大小为1×1和3×3的组合,利用1×1的卷积核对图像特征进行降维,再用3×3的卷积核对图像特征进行卷积操作,提取更加精细的图像特征,每经过一层卷积层之后都使用Relu激活函数激活,并添加批量归一化层;每一组1×1和3×3的卷积层通过跳跃连接组成残差块结构。
4.根据权利要求1所述一种基于卷积神经网络结构提取图像特征的方法,其特征是包括下述步骤:
(1)图像输入,图像经过3个3×3卷积层和2个最大池化层之后,输出特征维度;
(2)连接残差块结构,再经过1个最大池化和3×3的卷积层之后输出第一特征向量;
(3)经过2个残差块结构,再经过1个最大池化和3×3的卷积层输出第二特征向量;
(4)经过4个残差块结构,输出第三特征向量;
(5)经过1个最大池化和3×3的卷积层输出的第四特征向量;
(6)经8个残差块结构,输出第五特征向量并与第三特征向量进行特征融合,输出为第五特征向量;
(7)经过3×3的卷积层和一个1×1的卷积层输出最终特征向量,并以最终特征向量对目标类别、置信度以及位置进行预测。
5.根据权利要求1~4任意一项所述一种基于卷积神经网络结构提取图像特征的方法,其特征是所述图像像素为416×416;
图像经过3个3×3卷积层和2个最大池化层之后,输出的特征维度为104×104×128;
(2)连接残差块结构,再经过1个最大池化和3×3的卷积层之后输出的第一特征向量为52×52×256;
(3)经过2个残差块结构,再经过1个最大池化和3×3的卷积层输出的第二特征向量为26×26×512;
(4)经过4个残差块结构,输出的第三特征向量为26×26×512;
(5)经过1个最大池化和3×3的卷积层输出的第四特征向量为13×13×1024;
(6)经8个残差块结构,输出第五特征向量的图像像素为13×13×1024,第五特征向量与第四特征向量进行特征融合,输出第六特征向量为13×13×3072;
(7)经过3×3的卷积层和一个1×1的卷积层输出最终特征向量为13×13×30。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910121702.8/1.html,转载请声明来源钻瓜专利网。