[发明专利]一种基于四通道卷积神经网络的树干纹理识别方法在审
申请号: | 201910762013.5 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110689039A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 宣琦;刘文成;翔云 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 33241 杭州斯可睿专利事务所有限公司 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 四通道 图像特征信息 图像预处理 多分类器 树干图像 纹理识别 自动学习 分类器 鲁棒性 区分度 数据集 树干 采集 图像 分类 保证 | ||
1.一种基于四通道卷积神经网络的树干纹理识别方法,其特征在于:所述方法包括以下步骤:
S1:树干图像数据集的采集,提取的是树干的特征,根据树干的纹理来识别树种,这就要求拍摄的树木图像主要聚焦在树干上,保证图像的完整性;
S2:对原始图像数据集进行预处理;
S3:对处理后的图像利用四通道卷积神经网络进行机器学习,训练多分类器。
2.如权利要求1所述的一种基于树干纹理的树种分类方法,其特征在于:所述步骤S1包括以下步骤:
S1.1:首先,图像的采集地点来自不同的地域,降低地理位置对分类的影响;
S1.2:其次,要求拍摄的树木图像主要聚焦在树干上,提取树干的纹理特征;
S1.3:最后,图像的采集要全面,每种树干的图片数量达到500张,对每一种树大致选取50棵左右,每一棵树都要对其进行前后左右以及不同高度的照片拍摄,保证同一位置只拍摄一张照片,每一棵树拍摄的照片约为10张。
3.如权利要求1或2所述的一种基于树干纹理的树种分类方法,其特征在于:所述步骤S2包括以下步骤:
S2.1:先将原始图像进行灰度化处理,采用的是加权平均法,将三个分量以不同的权值进行加权平均,由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,按下式对RGB三分量进行加权平均能得到较合理的灰度图像,灰度化的定义为f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)
S2.2:最后将归一化后的图像裁剪成四张大小相同的图片,且每一张图片上都要包含树干纹理特征,裁剪的方式为沿图像水平对称轴和垂直对称轴裁剪;
S2.3:然后将灰度化后的图像进行归一化处理,归一化的目的就是使得预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响,归一化的定义为
image=image/255.0。
4.如权利要求1或2所述的一种基于树干纹理的树种分类方法,其特征在于:所述步骤S3包括以下步骤:
S3.1:构建四通道卷积神经网络模型,将每一张图划分为4个子图,将每一个子图单独输入到通道中,在softmax分类层之前将4个通道的值相加,目的就是充分利用每一张子图的信息,在一定程度上增加了数据集,以提高模型精度,且能提高系统的鲁棒性,降低个别特征对分类准确度的影响,这4个通道均是相同的卷积神经网络,且权值共享,这样能提取到更多的图像纹理特征,又能减少训练的参数;
S3.2:卷积神经网络各网络层的参数计算;
卷积层层面,由于使用的是四通道卷积神经网络,同一个卷积核有不同的输入,从而迫使它们抽取相同的特征,网络最终学习到的卷积核,可以视为特征提取模板,提取的特征视为四张子图的共同特征,R为学习到的特征,r1~r4为各子网络的特征,记
R=(r1+r2+r3+r4)/4
将卷积后的结果通过非线性激活函数,这里使用ReLU(rectified linear units)函数:f(x)=max(0,x),得到非线性变化后的结果,记
C=[c1 c2…cn]
网络的池化层使用最大池化P=max{C},池化的本质是对卷积后的结果进行统计计算,池化,池化后的结果记为
Z=[p1 p2…pm]
然后将各卷积和池化层提取的特征通过Dropout层,其做法是每次前向传播时随机将一定比例的隐层节点权值置为零,也就是这部分节点不参与此次更新,从而使权值的更新不依赖于固定关系节点的共同作用,从而降低过拟合,记
其中表示按位相乘;r∈Rm表示随机向量,服从参数为D的Bernoulli分布,它的作用相当于一个掩模,与池化层的输出按对应位相乘,从而将池化层的一部分输出随机置零,m表示卷积核的个数,使用Dropout可以抑制神经网络的过拟合经过Dropout后的向量y,作为句子的特征输入到最后的softmax分类器g=W2Y,其中:W2∈RI x m是转移矩阵;I为待分类的类别数目;输出O是一个I维的向量,第i维表示属于第i类的概率;
输出类别是i的概率为
i表示K中某个分类,gi表示该分类的值;
S3.3:更新模型参数,逐步提高模型的精确度,选择精度最高的模型作分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910762013.5/1.html,转载请声明来源钻瓜专利网。