[发明专利]一种基于变分组卷积的图像识别方法有效
申请号: | 201711419380.2 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108009594B | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 张弘;辛淼;张泽宇 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分组 卷积 图像 识别 方法 | ||
1.一种基于变分组卷积的图像识别方法,其特征在于:包括以下步骤:
第一步,对一张输入图像进行RGB通道拆分,每个通道作为初始的特征图,共3个特征图,作为初始输入;
第二步,使用原始的5层AlexNet卷积神经网络,为每一层的m个卷积核,分配每个卷积核对应的1组卷积特征图;
第三步,对各个卷积核和对应的不同数量,即变分组的特征图组计算二维卷积,得到本层的输出特征图,同时也是下一层的输入特征图,完成第一层的特征图计算,同样的过程依次完成第2层到第5层的输出特征图,将第5层的输出特征矩阵按行展开成一维向量,即得到输出特征,使用softmax函数对输出特征进行概率化映射,得到输出类别向量;
第四步,使用均方误差计算AlexNet卷积神经网络模型的输出类别向量与输入图像的类别真值向量之间的损失值,通过误差反向传播算法更新AlexNet中卷积核的参数,即完成了对AlexNet卷积神经网络模型的一次更新,通过在imagenet数据集上进行训练,得到训练完的AlexNet卷积神经网络模型,最终使用训练完的AlexNet卷积神经网络模型对输入图像进行图像识别。
2.根据权利要求1所述的基于变分组卷积的图像识别方法,其特征在于:所述第二步,m个卷积核中,对于每个卷积核,分配对应的卷积特征图的方法如下:假设当前的层有n个输入特征图,对n个特征图进行的组合,假设共有n′个组合的特征图,即,
从这n′个组合中随机抽出m个组合的特征图,每个这样的组合对应一个卷积核,共有m个卷积核。
3.根据权利要求1所述的基于变分组卷积的图像识别方法,其特征在于:所述第三步,对于m个组的卷积特征图,假设当前第l层的m个卷积核中的第i个卷积核对应k个输入特征图,则对k个特征图进行卷积,
其中Wi是卷积核权重系数矩阵,Wi在初始时由随机数构成,代表二维离散卷积操作,表示卷积核权重系数矩阵Wi对应的输入特征图,表示卷积后得到的特征图;由于每个卷积核对应的输入特征图数量不同,对于不同卷积核的k是不同的,即是变分组卷积;通过公式(2)完成的是一个卷积核的操作,如果当前层有m个卷积核,则进行m次公式(2)的操作,得到m个特征图作为当前层的输出;当前层的输出为下一层的输入,下一层采用同样的通道选取方法核卷积方法;以此类推,直到第5个卷积层,将第5层的输出特征矩阵按行展开成一维向量,即可得到输出特征,使用softmax函数对输出特征进行概率化映射,得到输出类别向量。
4.根据权利要求1所述的基于变分组卷积的图像识别方法,其特征在于:所述m小于等于32。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711419380.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:二位二通电磁稳压阀
- 下一篇:一种无线电产品可重构综合开发测试系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序