[发明专利]一种基于Transformer序列到序列模型的径流预测方法在审

申请号：	202210558117.6	申请日：	2022-05-21
公开（公告）号：	CN115146700A	公开（公告）日：	2022-10-04
发明（设计）人：	尹翰林;郭子龙;张秀伟;张艳宁	申请（专利权）人：	西北工业大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G01C13/00;G01W1/14
代理公司：	西安凯多思知识产权代理事务所(普通合伙) 61290	代理人：	高凌君
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 transformer 序列模型径流预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于Transformer序列到序列模型的径流预测方法，其特征在于，包括如下步骤：

步骤1：准备数据集并进行预处理；

收集研究流域内的气象数据以及水文站点的径流数据，构成原始数据集；然后对原始数据集进行预处理，预处理过程包括空值处理、数据选择、标准化和数据序列化；

步骤2：将预处理过的数据集划分出训练集、验证集、测试集三个互斥的集合；

步骤3：构建Transformer序列到序列模型；

Transformer序列到序列模型的架构包括：输入变换层、位置编码层、编码器、解码器、输出变换层和输出选择操作，具体步骤如下：

步骤3-1：输入变换层对输入数据的维度进行变换，统一数据维度；

步骤3-2：位置编码层向输入数据注入位置信息；

步骤3-3：编码器由多个编码器层前后串接而成，每个编码器层包含两个子层：多头自注意力和全连接层，每个子层之后都需要接入残差连接和层归一化；

编码器的输入序列为：

(x₁,x₂,…,x_{past_len+pred_len})

其中past_len表示已知的序列长度，pred_len表示预测的序列长度；

步骤3-4：解码器由多个解码器层前后串接而成，每个解码器层包含三个子层：多头自注意力、多头交叉注意力和全连接层，每个子层之后都接入残差连接和层归一化；

解码器的输入序列为：

(y₁,y₂,…,y_{past_len},0₁,0₂,…,0_{pred_len})

其中past_len表示已知的序列长度，pred_len表示预测的序列长度，0₁,0₂,…表示使用0进行填充，一共有pred_len个位置需要填充0；

步骤3-5：多头自注意力和多头交叉注意力；

计算：

Q＝W_QI₁

K＝W_KI₂

V＝W_VI₃

其中，W_Q、W_K、W_V是可学习参数矩阵，softmax表示进行Softmax操作，当输入I₂和I₃相同并且与输入I₁不同时，Attn(Q,K,V)称为交叉注意力；当三个输入I₁，I₂，I₃都相同时，Attn(Q,K,V)称为自注意力；Q表示I₁经过参数为W_Q的线性变换得到的结果，K表示I₂经过参数为W_K的线性变换后得到的结果，V表示I₃经过参数为W_V的线性变换后得到的结果；