[发明专利]基于迁移学习的连续大规模水质缺失数据填补方法在审

申请号：	202110040587.9	申请日：	2021-01-13
公开（公告）号：	CN112765141A	公开（公告）日：	2021-05-07
发明（设计）人：	蒋鹏;陈锃;许欢;刘俊;林广	申请（专利权）人：	杭州电子科技大学
主分类号：	G06F16/215	分类号：	G06F16/215;G06N3/04;G06N3/08
代理公司：	浙江千克知识产权代理有限公司 33246	代理人：	周希良
地址：	310018 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于迁移学习连续大规模水质缺失数据填补方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于迁移学习的连续大规模水质缺失数据填补方法，其特征在于该方法包括以下步骤：

数据预处理：

将从某个水质监测站传感器所收集的不完整数据序列进行清洗、标准归一化并将其定义为实验数据；

利用时间序列相似查询的方法找出最相似于不完整数据序列的监测站点的数据并将其定为参考数据；

使用滑动窗口算法构造出训练和测试样本；

数据填补：

设含有少量训练样本且数据大规模连续缺的水质监测站点为目标域，而具有完整训练样本的水质监测站点为源域；

将目标域的训练样本和源域的训练样本融合成为新的混合训练样本集；

初始化源域和目标域的训练样本的权重分布、弱学习器权重系数：最大迭代次数以及定义混合训练样本的权重分布；

开始进行迭代运算：

每次迭代中，分别构造一个新的填补数据的弱学习器；

在新混合的训练样本上计算平均预测填补误差；

分别计算源域的训练样本和目标域的训练样本的权重迭代更新系数；

根据t时刻的权重更新t+1时刻源域和目标域训练样本新的权重；完成一次弱学习器训练，重新开始迭代过程，直至达到最大的迭代次数时跳至输出；

输出：将所有弱学习器的输出值进行加权平均即可得到一个强学习器的最终预测填补数值。

2.根据权利要求1所述的基于迁移学习的连续大规模水质缺失数据填补方法，其特征在于：所述的时间序列相似查询的方法使用动态时间弯曲算法。

3.根据权利要求1所述的基于迁移学习的连续大规模水质缺失数据填补方法，其特征在于：

源域的训练样本初始化后的权重分布：

目标域的训练样本初始化后的权重分布：

弱学习器采用长短期记忆网络LSTM，其中LSTM中混合训练样本的权重迭代更新系数：

其中M为源域训练样本的个数，N为目标域训练样本的个数，i＝1,2,3…,M，j＝1,2,3…,N，iter为最大迭代次数。

4.根据权利要求3所述的基于迁移学习的连续大规模水质缺失数据填补方法，其特征在于：所述的填补误差计算如下：

其中Y^k为预测填补值，L^k为弱学习器LSTM的输出，k＝1,2,3…,M+N。

5.根据权利要求4所述的基于迁移学习的连续大规模水质缺失数据填补方法，其特征在于：权重迭代更新系数β_t计算如下：

6.根据权利要求5所述的基于迁移学习的连续大规模水质缺失数据填补方法，其特征在于：

t+1时刻源域训练样本新的权重为

t+1时刻目标域训练样本新的权重为：

7.根据权利要求6所述的基于迁移学习的连续大规模水质缺失数据填补方法，其特征在于：最终预测填补数值pred_value^k计算如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110040587.9/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载