[发明专利]一种基于八元数卷积神经网络的图像分类方法有效
申请号: | 201810748292.5 | 申请日: | 2018-07-10 |
公开(公告)号: | CN109086802B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 伍家松;徐玲;孔佑勇;杨冠羽;章品正;杨淳沨;姜龙玉;舒华忠 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 八元数 卷积 神经网络 图像 分类 方法 | ||
1.一种基于八元数卷积神经网络的图像分类方法,其特征在于,包括以下步骤:
(1)输入训练图像,并且将训练图像表示成八元数矩阵的形式;
(2)构建八元数卷积神经网络模型,并对其进行训练;
(3)用校验图像集进行校验,调整到最佳网络参数;
(4)对测试图像进行测试,统计分类结果,计算识别率;
步骤(2)所述八元数卷积神经网络包括八元数卷积层和八元数批规范化层;
所述步骤(2)包括以下步骤:
(21)将八元数的实部R及由步骤(1)得到八元数的七个虚部I,J,K,E,L,M,N,按照给定轴相接构成向量O作为网络的输入;
(22)按照给定轴相接构成向量O作为网络的输入,通过八元数卷积层、八元数批规范化层、激活函数层的操作,得到输出特征向量Oi,i=1,2...,N,其中Oi表示网络中第i层的输出特征向量;
(23)将特征向量Oi送入三个阶段的残差块中,再进行卷积后处理,最后编译模型,得到的返回值就是八元数卷积神经网络模型。
2.根据权利要求1所述的一种基于八元数卷积神经网络的图像分类方法,其特征在于,所述步骤(1)包括以下步骤:
(11)对输入特征图R进行实数批规范化操作;
(12)将输出特征向量Oi通过ReLU激活函数层;
(13)对ReLU激活函数层输出的结果进行二维滑动窗卷积操作;
(14)重复执行(11)、(12)、(13)。
3.根据权利要求1所述的一种基于八元数卷积神经网络的图像分类方法,其特征在于,所述步骤(3)包括以下步骤:
(31)将一个数据集,分割成三部分,一部分数据集为训练图像集,一部分为校验图像集,另一部分为测试图像集;
(32)采用训练图像集得到所构造的网络的滤波器后,再采用校验图像集进行参数的调优,获得最佳网络参数。
4.根据权利要求1所述的一种基于八元数卷积神经网络的图像分类方法,其特征在于,所述步骤(22)包括以下步骤:
(221)将卷积中向量和滤波器用八元数表示,八元数向量h表示为:h=x0+x1e1+x2e2+x3e3+x4e4+x5e5+x6e6+x7e7,八元数滤波矩阵W表示为:W=A0+A1e1+A2e2+A3e3+A4e4+A5e5+A6e6+A7e7,其中A0~A7是实数矩阵,x0~x7是实数向量;
(222)将八元数向量和八元数滤波器进行卷积运算得到:
Wh=(A0+A1e1+A2e2+A3e3+A4e4+A5e5+A6e6+A7e7)
(x0+x1e1+x2e2+x3e3+x4e4+x5e5+x6e6+x7e7)
=(A0x0-A1x1-A2x2-A3x3-A4x4-A5x5-A6x6-A7x7)+(A0x1+A1x0+A2x3-A3x2+A4x5-A5x4-A6x7+A7x6)e1+(A0x2-A1x3+A2x0+A3x1+A4x6+A5x7-A6x4-A7x5)e2+(A0x3+A1x2-A2x1+A3x0+A4x7-A5x6+A6x5-A7x4)e3+(A0x4-A1x5-A2x6-A3x7+A4x0+A5x1+A6x2+A7x3)e4+(A0x5+A1x4+A3x6-A2x7-A4x1+A5x0-A6x3+A7x2)e5+(A0x6+A1x7+A2x4-A3x5-A4x2+A5x3+A6x0-A7x1)e6+(A0x7-A1x6+A2x5+A3x4-A4x3-A5x2+A6x1+A7x0)e7;
(223)将卷积结果用矩阵表示:
(224)将经过零均值化数据乘以8×8协方差矩阵V[x]的平方根来实现将数据按两个主分量的方差的平方根进行缩放进行白化预处理:
(225)将V[x]进行Cholesky分解来白化8×8向量,W看作是V[x]-1的一个Cholesky分解,且假设:
Vij表示矩阵V的第i行第j列元素,且i,j=1,2,…,7,首先由再由这样便得到了矩阵W的第一列元素,假定已经算出了W的前d-1列元素,通过可得到进一步再由最终得到这样便通过W的前d-1列求出了第d列,一直递推下去即可求出W的全部元素;
(226)采用变换重构,引入可学习参数γ,β,其中β=E[x],β本身就是一个八元数值,有实部和七个虚部,共八个学习的分量,缩放参数γ是大小与V[x]匹配的对称矩阵,由于对称性有36个可学习的参数;
(227)得到批规范化网络层的前向传导过程公式:为了使输入的经过归一化后方差为1,将γ的对角线都初始化为将γ的非对角线和β的所有分量都初始化为0。
5.根据权利要求1所述的一种基于八元数卷积神经网络的图像分类方法,其特征在于,所述步骤(23)包括以下步骤:
(231)将特征向量Oi送入三个阶段的残差块中,将所获得的输入按序进行八元数批规范化、激活函数、八元数卷积、八元数批规范化、激活函数、八元数卷积操作,三阶段中每一个阶段都存在多个包含两个卷积层的残差块,通过设置每一阶段的残差块数量来调整网络结构的大小,通过调整步长来减少计算量,使特征图的输出减少为输入的两倍;
(232)将特征向量在竖直和水平方向上进行均值下采样,下采样因子为长为8的整数元组,即用8×8模板,使64个相邻像素经过加权计算变成一个,特征向量在两个维度上均变为原长的1/8;
(233)将输出的多维数据一维化;
(234)最后编译模型,得到的返回值就是八元数卷积神经网络模型,对网络进行初始化,然后在训练数据上按批进行一定次数的迭代训练,以拟合网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810748292.5/1.html,转载请声明来源钻瓜专利网。