lstm_ae.py

import copy
from torch.optim.adam import Adam
from preprocess_data import *
from utils import *
from config import *

import torch
from torch import nn

from datetime import datetime
# Third Party
import torch
import torch.nn as nn


############
# COMPONENTS
############


class Encoder(nn.Module):
    def __init__(self, input_dim, out_dim, h_dims, h_activ, out_activ, use_hidden = True):
        super(Encoder, self).__init__()

        self.use_hidden = use_hidden
        layer_dims = [input_dim] + h_dims + [out_dim]
        self.num_layers = len(layer_dims) - 1
        self.layers = nn.ModuleList()
        for index in range(self.num_layers):
            layer = nn.LSTM(
                input_size=layer_dims[index],
                hidden_size=layer_dims[index + 1],
                num_layers=1,
                batch_first=True
            )
            self.layers.append(layer)

        self.h_activ, self.out_activ = h_activ, out_activ

    def forward(self, x):
        # x = x.unsqueeze(0)
        for index, layer in enumerate(self.layers):
            x, (h_n, c_n) = layer(x)

            if self.h_activ and index < self.num_layers - 1:
                x = self.h_activ(x)
            elif self.out_activ and index == self.num_layers - 1:
                if(self.use_hidden):
                    return self.out_activ(h_n).squeeze()

                return self.out_activ(x).squeeze()

        return x

class Decoder(nn.Module):
    def __init__(self, input_dim, out_dim, h_dims, h_activ, use_hidden = True):
        super(Decoder, self).__init__()

        self.use_hidden = use_hidden
        layer_dims = [input_dim] + h_dims + [out_dim]
        self.num_layers = len(layer_dims) - 1
        self.layers = nn.ModuleList()
        for index in range(self.num_layers):
            layer = nn.LSTM(
                input_size=layer_dims[index],
                hidden_size=layer_dims[index + 1],
                num_layers=1,
                batch_first=True
            )
            self.layers.append(layer)

        self.h_activ = h_activ
        # self.dense_matrix = nn.Parameter(
        #     torch.rand((layer_dims[-1], out_dim), dtype=torch.float),
        #     requires_grad=True
        # )

        # self.output_layer = nn.Linear(layer_dims[-1], out_dim)

    def forward(self, x, seq_len):
        if(self.use_hidden):
            x = x.unsqueeze(1).repeat(1,seq_len,1)
        for index, layer in enumerate(self.layers):
            x, (h_n, c_n) = layer(x)

            if self.h_activ and index < self.num_layers - 1:
                x = self.h_activ(x)

        # x = self.output_layer(x)
        return x
# class Decoder(nn.Module):
#     def __init__(self, input_dim, out_dim, h_dims, h_activ, use_hidden = True):
#         super(Decoder, self).__init__()

#         self.use_hidden = use_hidden
#         layer_dims = [input_dim] + h_dims + [h_dims[-1]]
#         self.num_layers = len(layer_dims) - 1
#         self.layers = nn.ModuleList()
#         for index in range(self.num_layers):
#             layer = nn.LSTM(
#                 input_size=layer_dims[index],
#                 hidden_size=layer_dims[index + 1],
#                 num_layers=1,
#                 batch_first=True
#             )
#             self.layers.append(layer)

#         self.h_activ = h_activ
#         # self.dense_matrix = nn.Parameter(
#         #     torch.rand((layer_dims[-1], out_dim), dtype=torch.float),
#         #     requires_grad=True
#         # )

#         self.output_layer = nn.Linear(layer_dims[-1], out_dim)

#     def forward(self, x, seq_len):
#         if(self.use_hidden):
#             x = x.unsqueeze(1).repeat(1,seq_len,1)
#         for index, layer in enumerate(self.layers):
#             x, (h_n, c_n) = layer(x)

#             if self.h_activ and index < self.num_layers - 1:
#                 x = self.h_activ(x)

#         x = self.output_layer(x)
#         return x

######
# MAIN
######


class LSTM_AE(nn.Module):
    def __init__(self, input_dim, encoding_dim, h_dims=[], h_activ=nn.Tanh(),
                 out_activ=nn.Tanh(), config=Config(), use_hidden=True):
        super(LSTM_AE, self).__init__()

        self.config: Config = config

        self.encoder = Encoder(input_dim, encoding_dim, h_dims, h_activ,
                               out_activ, use_hidden=use_hidden)
        self.decoder = Decoder(encoding_dim, input_dim, h_dims[::-1],
                               h_activ, use_hidden=use_hidden)

    def forward(self, x):
        
        x = self.encoder(x)
        x = self.decoder(x, self.config.len_seq)

        return x


import copy
from torch.optim.adam import Adam
from preprocess_data import *
from utils import *

import torch
from torch import nn

from datetime import datetime

class TrainSequiturLSTMAE():
    net = None
    config: Config = None
    
    def print_stats(self):
        train_stats = np.unique([a for y in self.y_train for a in y],return_counts=True)[1]
        val_stats = np.unique([a for y in self.y_val for a in y],return_counts=True)[1]

        print('Training set statistics:')
        print(len(train_stats),'classes with distribution',train_stats)
        print('Validation set statistics:')
        print(len(val_stats),'classes with distribution',val_stats)

    def print_config(self):
        config = self.config
        print("Configuration:")
        vars = list(filter(lambda x: x[0] != '_', dir(config)) )
        for var in vars:
            print(str(var) + ": ", getattr(config, var))


    def __init__(self,encoding_dim=32, h_dims=[128], h_activ=nn.Sigmoid(), out_activ=nn.Tanh(), config: Config = Config()) -> None:
        self.config = config

        self.print_config()


        self.train_on_gpu = config.train_on_gpu = train_on_gpu = torch.cuda.is_available()
        print("Train on GPU? ", train_on_gpu)

        self.net = net = LSTM_AE(encoding_dim=encoding_dim, input_dim= config.n_channels, h_dims=h_dims, h_activ=h_activ,out_activ=out_activ, config=config, use_hidden=False)


        self.X_train, self.y_train = load_data('train',config.len_seq,config.stride, removeAnom=True)
        self.X_val, self.y_val = load_data('val',config.len_seq,config.stride)

        # net.apply(init_weights)


        self.optimizer = Adam(net.parameters(), lr=config.lr)
        self.criterion = nn.L1Loss(reduction='sum')
        # self.history = dict(train=[], val=[])
        # self.best_model_wts = copy.deepcopy(net.state_dict)
        # self.best_loss = 10000.0
        # self.print_stats()

    def train(self, denoise=False):
        # criterion = MSELoss(size_average=False)
        optimizer = self.optimizer
        criterion = self.criterion

        config = self.config
        net = self.net

        if(config.train_on_gpu):
            net = net.cuda()

        mean_losses = []
        for epoch in range(1, config.num_epochs + 1):
            net.train()


            # # Reduces learning rate every 50 epochs
            # if not epoch % 50:
            #     for param_group in optimizer.param_groups:
            #         param_group["lr"] = lr * (0.993 ** epoch)

            losses = []

            # for batch in iterate_minibatches_2D(self.X_train, self.y_train, config.batch_size, config.stride, shuffle=True, num_batches=1, batchlen=config.batchlen, drop_last=True):
            for batch in iterate_minibatches_2D(self.X_train, self.y_train, config.batch_size, config.stride, shuffle=True, num_batches=config.num_batches, batchlen=config.batchlen, drop_last=True):
                # print("lol")
                x,y ,pos = batch
                # for x in seq:
                x = torch.from_numpy(x)

                if(config.train_on_gpu):
                    x = x.cuda()
                
                optimizer.zero_grad()

                # Forward pass
                x_prime = net(x)

                loss = criterion(x_prime, x)

                # Backward pass
                loss.backward()
                optimizer.step()

                losses.append(loss.item())

            mean_loss = np.mean(losses)
            mean_losses.append(mean_loss)

            print(f"Epoch: {epoch}, Loss: {mean_loss}")

        return mean_losses


    def get_encodings(self, model, train_set):
        self.net.eval()
        encodings = [self.net.encoder(x) for x in train_set]
        return encodings

config:Config = Config()
config.batch_size = 1000
config.num_epochs = 20
config.lr = 0.001
trainer = TrainSequiturLSTMAE(config=config)
losses = trainer.train()