[发明专利]一种基于多模型改进的Stacking集成学习鱼类识别方法有效
申请号: | 201910524947.5 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110414554B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 尚悦;李建龙 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/77;G06V10/774;G06V10/80;G06K9/62 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 改进 stacking 集成 学习 鱼类 识别 方法 | ||
1.一种基于多模型改进的Stacking集成学习鱼类识别方法,包括如下步骤:
(1)利用成像声呐向鱼类发射脉冲信号,接收并存贮鱼体反向散射回波数据;
(2)对数据进行预处理,包括对存贮的时域回波信号进行傅里叶变换,得到回波信号的频谱;对存贮的时域回波信号进行短时傅里叶变换,得到回波信号的时频图;
(3)从步骤(2)的预处理结果中提取特征,包括对时域回波信号利用基于主成分分析的特征提取方法提取特征TPCA;对回波频谱利用基于主成分分析的特征提取方法提取特征SPCA;对回波时频图利用基于卷积神经网络的特征提取方法提取特征SGCNN;
(4)将特征TPCA,SPCA和SGCNN分别输入基于多模型改进的Stacking集成学习各个基学习器进行决策,融合基学习器分类结果作为元学习器的输入特征量,元学习器输出最终分类结果,实现鱼种分类识别;
步骤(3)包括:
(3-1)分别对时域回波信号和回波频谱利用基于主成分分析的特征提取方法提取特征TPCA,SPCA:对于第s个鱼类回波信号样本向量Xs=(x1,x2,...,xN)T,N为鱼类回波信号长度,其协方差矩阵为
其中,为样本平均值,M为样本数;计算C的特征值λ1,λ2,...,λN和对应的特征向量u1,u2,...,uN,将各特征值从大到小进行排列:λ1≥λ2≥...≥λN;取数据样本的前m个主分量作为新特征Y,输入后续分类器进行训练和测试;新特征通过下式计算得到
Y=UTXs, (2)
其中U=(u1,u2,...,um),Y=(y1,y2,...,ym);
(3-2)对于鱼类回波时频图利用基于卷积神经网络的特征提取方法提取特征SGCNN:特征提取阶段的卷积神经网络由输入层{conv1,conv2,conv3,conv4,pool5,fc6,fc7}构成,即首先通过4层卷积层级联,对特征图进行层层迭代抽象和组合,挖掘鱼类回波中隐含的更复杂和深层次的信息;再通过池化层聚合特征,最后级联两层全连接层将所有二维图像的特征图拼接为一维特征,全连接层最后输出的一维特征作为后续分类器的输入特征量;
步骤(4)包括:首先划分原始数据集为训练集和测试集,采取n折交叉验证方法基于原始训练集训练提出的基于多模型改进的Stacking集成学习分类器;针对鱼类回波特征TPCA,使用3折交叉验证的方法将训练集分为3份,生成训练子集1,训练决策树模型,记为分类器1,将训练子集的预测值拼凑起来,记为A1;同样地,针对鱼类回波特征SPCA,使用3折交叉验证的方法将训练集分为3份,生成训练子集2,训练AdaBoost模型,记为分类器2,将训练子集的预测值拼凑起来,记为A2;针对鱼类回波特征SGCNN,使用3折交叉验证的方法将训练集分为3份,生成训练子集3,训练前馈神经网络模型,记为分类器3,将训练子集的预测值拼凑起来,记为A3;将A1,A2,A3并列合并得到一个新的矩阵作为元学习器的训练集,训练多元逻辑回归模型,得到最终基于多模型改进的Stacking集成学习分类器;对于测试集,首先将鱼类回波信号进行预处理后,分别提取特征TPCA,特征SPCA和特征SGCNN;将三种特征分别作为分类器1,分类器2和分类器3的输入,将各分类器的分类结果作为多元逻辑回归元学习器的输入,获得的多元逻辑回归学习器输出即为最终分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910524947.5/1.html,转载请声明来源钻瓜专利网。