本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.
I. 前言
前面已经写了很多关于时间序列预测的文章,这些文章一共采用了LSTM、ANN以及CNN三种模型来分别进行时间序列预测。众所周知,CNN提取特征的能力非常强,因此现在不少论文将CNN和LSTM结合起来进行时间序列预测。本文将利用PyTorch来搭建一个简单的CNN-LSTM混合模型实现负荷预测。
II. CNN-LSTM
CNN-LSTM模型搭建如下:
class CNN_LSTM(nn.Module): def __init__(self, args): super(CNN_LSTM, self).__init__() self.args = args self.relu = nn.ReLU(inplace=True) # (batch_size=30, seq_len=24, input_size=7) ---> permute(0, 2, 1) # (30, 7, 24) self.conv = nn.Sequential( nn.Conv1d(in_channels=args.in_channels, out_channels=args.out_channels, kernel_size=3), nn.ReLU(), nn.MaxPool1d(kernel_size=3, stride=1) ) # (batch_size=30, out_channels=32, seq_len-4=20) ---> permute(0, 2, 1) # (30, 20, 32) self.lstm = nn.LSTM(input_size=args.out_channels, hidden_size=args.hidden_size, num_layers=args.num_layers, batch_first=True) self.fc = nn.Linear(args.hidden_size, args.output_size) def forward(self, x): x = x.permute(0, 2, 1) x = self.conv(x) x = x.permute(0, 2, 1) x, _ = self.lstm(x) x = self.fc(x) x = x[:, -1, :] return x
可以看到,该CNN-LSTM由一层一维卷积+LSTM组成。
通过 PyTorch搭建CNN实现时间序列预测(风速预测) 我们知道,一维卷积的原始定义如下:
nn.Conv1d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True)
本文模型的一维卷积定义:
nn.Conv1d(in_channels=args.in_channels, out_channels=args.out_channels, kernel_size=3)
这里in_channels的概念相当于自然语言处理中的embedding,因此输入通道数为7,表示负荷+其他6个环境变量;out_channels的可以随意设置,本文设置为32;kernel_size设置为3。
PyTorch中一维卷积的输入尺寸为:
input(batch_size, input_size, seq_len)=(30, 7, 24)
而经过数据处理后得到的数据维度为:
input(batch_size, seq_len, input_size)=(30, 24, 7)
因此,我们需要进行维度交换:
x = x.permute(0, 2, 1)
交换后的输入数据将符合CNN的输入。
一维卷积中卷积操作是针对seq_len维度进行的,也就是(30, 7, 24)中的最后一个维度。因此,经过:
nn.Conv1d(in_channels=args.in_channels, out_channels=args.out_channels, kernel_size=3)
后,数据维度将变为:
(30, 32, 24-3+1)=(30, 32, 22)
第一维度的batch_size不变,第二维度的input_size将由in_channels=7变成out_channels=32,第三维度进行卷积变成22。
然后经过一个最大池化变成:
(30, 32, 22-3+1)=(30, 32, 20)
此时的(30, 32, 20)将作为LSTM的输入。由于在LSTM中我们设置了batch_first=True,因此LSTM能够接收的输入维度为:
input(batch_size, seq_len, input_size)
而经卷积池化后得到的数据维度为:
input(batch_size=30, input_size=32, seq_len=20)
因此,同样需要进行维度交换:
x = x.permute(0, 2, 1)
然后就是比较常规的LSTM输入输出的,不再细说。
因此,完整的forward函数如下所示:
def forward(self, x): x = x.permute(0, 2, 1) x = self.conv(x) x = x.permute(0, 2, 1) x, _ = self.lstm(x) x = self.fc(x) x = x[:, -1, :] return x
III. 代码实现
3.1 数据处理
我们根据前24个时刻的负荷以及该时刻的环境变量来预测接下来4个时刻的负荷,这里采用了直接多输出策略,调整output_size即可调整输出步长。
3.2 模型训练/测试
和前文一致。
3.3 实验结果
简单训练30轮,前24个时刻预测未来4个时刻,MAPE为6.88%:
IV. 源码及数据
后面将陆续公开~
Be First to Comment