Press "Enter" to skip to content

PyTorch搭建CNN-LSTM混合模型实现多变量多步长时间序列预测(负荷预测)

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

I. 前言

 

前面已经写了很多关于时间序列预测的文章,这些文章一共采用了LSTM、ANN以及CNN三种模型来分别进行时间序列预测。众所周知,CNN提取特征的能力非常强,因此现在不少论文将CNN和LSTM结合起来进行时间序列预测。本文将利用PyTorch来搭建一个简单的CNN-LSTM混合模型实现负荷预测。

 

II. CNN-LSTM

 

CNN-LSTM模型搭建如下:

 

class CNN_LSTM(nn.Module):
    def __init__(self, args):
        super(CNN_LSTM, self).__init__()
        self.args = args
        self.relu = nn.ReLU(inplace=True)
        # (batch_size=30, seq_len=24, input_size=7) ---> permute(0, 2, 1)
        # (30, 7, 24)
        self.conv = nn.Sequential(
            nn.Conv1d(in_channels=args.in_channels, out_channels=args.out_channels, kernel_size=3),
            nn.ReLU(),
            nn.MaxPool1d(kernel_size=3, stride=1)
        )
        # (batch_size=30, out_channels=32, seq_len-4=20) ---> permute(0, 2, 1)
        # (30, 20, 32)
        self.lstm = nn.LSTM(input_size=args.out_channels, hidden_size=args.hidden_size,
                            num_layers=args.num_layers, batch_first=True)
        self.fc = nn.Linear(args.hidden_size, args.output_size)
    def forward(self, x):
        x = x.permute(0, 2, 1)
        x = self.conv(x)
        x = x.permute(0, 2, 1)
        x, _ = self.lstm(x)
        x = self.fc(x)
        x = x[:, -1, :]
        return x

 

可以看到,该CNN-LSTM由一层一维卷积+LSTM组成。

 

通过 PyTorch搭建CNN实现时间序列预测(风速预测) 我们知道,一维卷积的原始定义如下:

 

nn.Conv1d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)

 

本文模型的一维卷积定义:

 

nn.Conv1d(in_channels=args.in_channels, out_channels=args.out_channels, kernel_size=3)

 

这里in_channels的概念相当于自然语言处理中的embedding,因此输入通道数为7,表示负荷+其他6个环境变量;out_channels的可以随意设置,本文设置为32;kernel_size设置为3。

 

PyTorch中一维卷积的输入尺寸为:

 

input(batch_size, input_size, seq_len)=(30, 7, 24)

 

而经过数据处理后得到的数据维度为:

 

input(batch_size, seq_len, input_size)=(30, 24, 7)

 

因此,我们需要进行维度交换:

 

x = x.permute(0, 2, 1)

 

交换后的输入数据将符合CNN的输入。

 

一维卷积中卷积操作是针对seq_len维度进行的,也就是(30, 7, 24)中的最后一个维度。因此,经过:

 

nn.Conv1d(in_channels=args.in_channels, out_channels=args.out_channels, kernel_size=3)

 

后,数据维度将变为:

 

(30, 32, 24-3+1)=(30, 32, 22)

 

第一维度的batch_size不变,第二维度的input_size将由in_channels=7变成out_channels=32,第三维度进行卷积变成22。

 

然后经过一个最大池化变成:

 

(30, 32, 22-3+1)=(30, 32, 20)

 

此时的(30, 32, 20)将作为LSTM的输入。由于在LSTM中我们设置了batch_first=True,因此LSTM能够接收的输入维度为:

 

input(batch_size, seq_len, input_size)

 

而经卷积池化后得到的数据维度为:

 

input(batch_size=30, input_size=32, seq_len=20)

 

因此,同样需要进行维度交换:

 

x = x.permute(0, 2, 1)

 

然后就是比较常规的LSTM输入输出的,不再细说。

 

因此,完整的forward函数如下所示:

 

def forward(self, x):
    x = x.permute(0, 2, 1)
    x = self.conv(x)
    x = x.permute(0, 2, 1)
    x, _ = self.lstm(x)
    x = self.fc(x)
    x = x[:, -1, :]
    return x

 

III. 代码实现

 

3.1 数据处理

 

我们根据前24个时刻的负荷以及该时刻的环境变量来预测接下来4个时刻的负荷,这里采用了直接多输出策略,调整output_size即可调整输出步长。

 

3.2 模型训练/测试

 

和前文一致。

 

3.3 实验结果

 

简单训练30轮,前24个时刻预测未来4个时刻,MAPE为6.88%:

 

IV. 源码及数据

 

后面将陆续公开~

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注