[发明专利]基于机器学习的温跃层预测方法在审
申请号: | 202010028048.9 | 申请日: | 2020-01-10 |
公开(公告)号: | CN111259943A | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 杨嘉琛;吕彩云 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 温跃层 预测 方法 | ||
1.一种基于机器学习的温跃层预测方法,利用三次样值插值对海洋样本数据进行非均匀校正,主成分分析算法对数据进行降维处理,FCM模糊聚类算法划分数据等级,BP神经网络训练数据集,从而构建出温跃层的预测模型。包括以下步骤:
1)对原始数据预处理获取样本数据:获取包含温度、盐度、纬向速度、经向速度、海面高度五个变量的海洋样本数据,构建数据集,利用三次样条插值对数据集进行插值预处理,获得均匀的数据集;
2)对于均匀的数据集,利用主成分分析PCA算法对数据进行降维处理,分析各变量对温跃层的影响:计算数据集的温度、盐度、高度特征与温跃层的协方差,求出协方差的特征值和特征向量,将特征值按照从大到小的顺序排序,选择其中最大的k个,然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵,得到降维后的数据集,获得温度、盐度、纬向速度、经向速度、海面高度五个与温度梯度存在相关的变量对温跃层影响程度;
3)对于降维后的数据集,基于拉普拉斯核函数的模糊聚类算法FCM对数据进行分类:将温跃层的信任等级从高到低划分为10个等级,利用模糊聚类算法FCM得到每个样本点所属中心点的隶属度,根据隶属度的数值,将其划分到10个等级之中,从而获得包含(样本点,所属的信任等级)的信任等级数据集;再利用拉普拉斯核函数代替模糊聚类算法FCM中的欧氏距离,用以提高传统FCM聚类算法的抗噪能力,使其能够准确地对样本进行分类;
4)BP神经网络训练数据,构建温跃层预测模型:本发明对于神经网络的中间层以及每一层的神经元都可以根据实际情况所调整,使用经验公式来确定隐含层神经元的数量,其中l是隐藏层神经元数量,n是输入层的神经元,m是输出层的神经元,a是1和10之间的常量;根据信任等级数据集,构建训练集和测试集;将利用主成分分析PCA算法分析出的与温度梯度存在相关的变量作为神经网络的输入,以信任等级作为网络的输出进行训练;通过梯度下降法和网络的反向传播,不断调整网络的权值和阈值,使网络的输出误差最小化;经过学习,网络中每个单元的连接权值趋于稳定,训练结束,获得温跃层预测模型;在此基础上,再次进行海洋区域的温跃层的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010028048.9/1.html,转载请声明来源钻瓜专利网。