[发明专利]基于多尺度多方向空间相关性建模的纹理图像分类方法在审
申请号: | 201810232936.5 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108596206A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 张敬;杨明月;文成林 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 黄前泽 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于多尺度多方向空间相关性建模的纹理图像分类方法。本发明是通过深度神经网络提取纹理图像特征,对特征图进行多方向的图像旋转,图像旋转后接入双向LSTM,经LSTM特征信息处理后进入softmax进行分类。它可以充分利用卷积层对局部空间相关性和LSTM单元长期空间相关性的表示能力。为了更加充分训练模型,采取数据增强。最后在两个基准数据集DTD和FMD进行了广泛的实验,以比较所提出的方法和最先进的方法。结果说明所提出的模型具有较强的纹理图像表示能力,取得了较好的性能。 | ||
搜索关键词: | 空间相关性 多方向 纹理图像分类 图像旋转 纹理图像 多尺度 建模 特征信息处理 基准数据 局部空间 神经网络 数据增强 训练模型 特征图 卷积 分类 | ||
【主权项】:
1.基于多尺度多方向空间相关性建模的纹理图像分类方法,其特征在于该方法包括以下步骤:步骤(1).数据集预处理将原始图像数据集使用垂直翻转与多尺度旋转进行数据增强,获取图像数目更多的数据集;步骤(2).深度卷积神经网络获取图像特征图将步骤(1)经垂直翻转与多尺度旋转后的图像输入到深度卷积神经网络,进行深度卷积处理,得到该图像的特征图;步骤(3).将步骤(2)卷积得到的特征图进行多方向旋转;设A(x0,y0)为步骤(3)旋转后得到的特征图坐标位置(x0,y0)处的像素值,其对应的旋转前的特征图像素为P(x3,y3),旋转角为θ,由于已知(x0,y0)则利用以下公式(1)可以求出(x3,y3)的坐标;x0=x3cosθ‑y3sinθy0=x3sinθ+y3cosθ (1)当求解的(x3,y3)是整数点时,A(x0,y0)直接更新为P(x3,y3),然后跳转到步骤(4);当求解的(x3,y3)不是整数点时,采用双线性插值法更新A(x0,y0),已知非整数点P(x3,y3)周围四个相邻点P11(x1,y1)、P12(x1,y2)、P21(x2,y1)、P22(x2,y2)的坐标值,则计算P(x3,y3)像素值的双线性插值方法如下:首先,在X方向进行插值,设P1(x3,y1)、P2(x3,y2)是在横坐标方向的中间插值结果,可以从公式(2)、(3)得到:![]()
然后,对P1(x3,y1)、P2(x3,y2)在Y方向再次插值,得到P(x3,y3)的像素值,如公式(4)所示:
其中设
为插值权重;P1(x3,y1)为在P11、P21水平方向上两点间任意坐标,P2(x3,y2)为P12、P22水平方向上两点间任意坐标;上述过程描述了旋转层前向计算过程;误差的反向传播计算过程如下:设旋转后特征图坐标(x0,y0)处的误差为ΔA(x0,y0),则其反向传播到旋转前特征图坐标(x1,y1)、(x1,y2)、(x2,y1)、(x2,y2)处的累积误差ΔP(x1,y1)、ΔP(x1,y2)、ΔP(x2,y1)、ΔP(x2,y2)的计算更新公式如下:
误差根据上述更新公式(5)反向传播到前一层,前一层按照标准卷积层等误差反向计算公式向前传播;步骤(4).将步骤(3)多方向旋转后的特征图,输入到LSTM进行空间相关性特征信息处理;步骤(5).图像分类:即通过LSTM得到图像特征信息,在用softmax分类器将不同类型的纹理图像进行分类,通过输出概率得到最终的分类结果;softmax分类器模型公式(5):
其中λ为图像的纹理特征,i、j为分类中的某一类,n为分类的全部总数,S为分类器的输出概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810232936.5/,转载请声明来源钻瓜专利网。