[发明专利]一种基于注意力机制的时序数据缺失值插补方法有效
申请号: | 202110533285.5 | 申请日: | 2021-05-17 |
公开(公告)号: | CN113298131B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 季薇;金博斌;李云 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 时序 数据 缺失 值插补 方法 | ||
1.一种基于注意力机制的时序数据缺失值插补方法,其特征在于,包括以下步骤:
获取有缺失值的气象时序数据;
将有缺失值的气象时序数据输入训练后的生成器,获取插补后的气象时序数据;
其中,生成器的训练包括:
将有缺失值的气象时序数据输入生成器,基于注意力机制获取完整的气象时序数据;
将有缺失值的气象时序数据和完整的气象时序数据输入判别器,基于损失函数,对判别器和生成器进行对抗式训练;
所述生成器为包括编码器单元和解码器单元的降噪自编码器;
所述获取完整的气象时序数据包括:
编码器单元根据输入的预设长度为m且有缺失值的原始气象时序数据x和随机噪声向量η,输出原始气象时序数据x的隐藏向量H;
解码器单元根据原始气象时序数据x和隐藏向量H结合注意力机制对原始气象时序数据x的缺失值进行插补,获取完整的气象时序数据
所述对原始气象时序数据x的缺失值进行插补,获取完整的气象时序数据包括:
根据第n时刻的原始气象时序数据Sn-1与每一时刻的隐藏向量H结合注意力机制,获取每个时刻的权重因子α;
根据每个时刻的权重因子α对所有隐藏向量H作加权平均;
将加权平均的结果带入双曲正切函数得到第n时刻的原始气象时序数据的完整值Sn;
将第n时刻的原始气象时序数据的完整值Sn作为第n+1时刻的原始气象时序数据带入上述步骤,循环计算得到所有时刻的原始气象时序数据的完整值S;
根据上述所有时刻的原始气象时序数据的完整值S获取完整的气象时序数据
其中,H={H1,H2,H3,…,Hi,…,Hm},Hi为第i时刻的隐藏向量,α={α1,α2,α3,…,αi,…,αm},αi为第i时刻的权重因子,S={S1,S2,S3,…,St,…,Sm},St为第t时刻的原始气象时序数据的完整值,S0=Hm,即解码器的初始输入向量为S0。
2.根据权利要求1所述的一种基于注意力机制的时序数据缺失值插补方法,其特征在于,获得每个时刻的权重因子α包括:
Ki=Wk·Hi
Qn-1=Wq·Sn-1
其中,Ki为注意力机制中第i个key值,Hi为第i时刻的隐藏向量;Qn-1为注意力机制中第n-1个query值,Sn-1为第n-1时刻的原始气象时序数据;Wk和Wq是从训练数据中学习得到的参数矩阵,Wk和Wq的初始值由随机初始化参数矩阵获得,并通过生成对抗网络的损失函数和反向传播算法进行更新;
令:
其中,为矩阵Ki的转置矩阵;
其中,αi为第i时刻的权重因子,softmax函数为归一化指数函数,用于将输入的值映射成0-1之间的正数输出,且其所有输出的权重因子α之和为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110533285.5/1.html,转载请声明来源钻瓜专利网。