RSOC_train_class2_CAM_DSAM.py

from __future__ import division
import warnings

from Network.baseline_DSAM_CAM import VGG
from utils import save_checkpoint

import torch
import torch.nn as nn
import torch.nn.functional as F

from torchvision import datasets, transforms
import dataset
import math
from image import *

warnings.filterwarnings('ignore')
from config import args
import  os
import scipy.misc
import imageio
import time
import random
import scipy.ndimage
import cv2
torch.cuda.manual_seed(args.seed)

os.environ['CUDA_VISIBLE_DEVICES'] = args.gpu_id


print(args)

' small-vehicle, large-vehicle 属于同一类 '

#VisDrone_category = ['pedestrian', 'people', 'bicycle', 'car', 'van', 'truck', 'tricycle', 'awning-tricycle', 'bus', 'motor']
VisDrone_category = ['small-vehicle', 'large-vehicle']

def feature_test(source_img, mask_gt, gt, mask, feature, save_pth, category):
    imgs = [source_img]
    for i in range(feature.shape[1]):
        np.seterr(divide='ignore', invalid='ignore')
        save_data = 255 * mask_gt[0, i,:,:] / np.max(mask_gt[0, i,:,:])
        save_data = save_data.astype(np.uint8)
        save_data = cv2.applyColorMap(save_data, 2)
        # save_data = cv2.putText(save_data, category[i], (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1.2, (0, 255, 0), 2)
        imgs.append(save_data)

        save_data = 255 * gt[0,i,:,:] / np.max(gt[0,i,:,:])
        save_data = save_data.astype(np.uint8)
        save_data = cv2.applyColorMap(save_data, 2)
        # save_data = cv2.putText(save_data, category[i], (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1.2, (0, 255, 0), 2)
        imgs.append(save_data)

        save_data = 255 * mask[0,i,:,:] / np.max(mask[0,i,:,:])
        save_data = save_data.astype(np.uint8)
        save_data = cv2.applyColorMap(save_data, 2)
        # save_data = cv2.putText(save_data, category[i], (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1.2, (0, 255, 0), 2)
        imgs.append(save_data)

        save_data = 255 * feature[0,i,:,:] / np.max(feature[0,i,:,:])
        save_data = save_data.astype(np.uint8)
        save_data = cv2.applyColorMap(save_data, 2)
        # save_data = cv2.putText(save_data, category[i], (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1.2, (0, 255, 0), 2)
        imgs.append(save_data)
    # for idx, image in enumerate(imgs):
    #     pth = os.path.join(os.path.dirname(save_pth), '{}.jpg'.format(idx))
    #     cv2.imwrite(pth, image)
    img = np.hstack(imgs)

    cv2.imwrite(save_pth, img)

def setup_seed(seed):
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    np.random.seed(seed)
    random.seed(seed)

def pre_data(train_list, train):
    print("Pre_load dataset ......")
    data_keys = {}

    # for j in range(10):
    for j in range(len(train_list)):
        Img_path = train_list[j]
        fname = os.path.basename(Img_path)
        # print(fname)
        img, target, kpoint, mask = load_data_mcc(Img_path, train)
        blob = {}
        blob['img'] = img
        blob['kpoint'] = np.array(kpoint)
        blob['target'] = np.array(target)
        blob['fname'] = fname
        blob['mask'] = np.array(mask)
        data_keys[j] = blob
        print(j, blob['img'].size, blob['target'].shape, blob['mask'].shape)

    return data_keys

def main():
    setup_seed(0)

    train_file = './npydata/RSOC_train.npy'
    val_file = './npydata/RSOC_test.npy'

    with open(train_file, 'rb') as outfile:
        train_list = np.load(outfile).tolist()
    with open(val_file, 'rb') as outfile:
        val_list = np.load(outfile).tolist()

    model = VGG()

    model = nn.DataParallel(model, device_ids=[0])
    model = model.cuda()

    mse_criterion =  nn.MSELoss(size_average=False).cuda()
    ce_criterion = nn.CrossEntropyLoss().cuda()
    criterion = [mse_criterion, ce_criterion]

    optimizer = torch.optim.Adam(model.parameters(), lr = args.lr, weight_decay=args.weight_decay)
    scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=args.lr_step, gamma=0.1, last_epoch=-1)
    print(args.pre)

    if args.pre:
        if os.path.isfile(args.pre):
            print("=> loading checkpoint '{}'".format(args.pre))
            checkpoint = torch.load(args.pre)
            model.load_state_dict(checkpoint['state_dict'])
            args.start_epoch = checkpoint['epoch']
            args.best_pred =  checkpoint['best_prec1']
            #rate_model.load_state_dict(checkpoint['rate_state_dict'])
        else:
            print("=> no checkpoint found at '{}'".format(args.pre))

    torch.set_num_threads(args.workers)

    print(args.best_pred)

    if not os.path.exists(args.task_id):
        os.makedirs(args.task_id)

    # train_pre_load = pre_data(train_list, train=True)
    # test_pre_load = pre_data(val_list, train=False)

    # ['plane', 'ship', 'small_vehicle', 'large_vehicle']
    best_mse = 1e5
    best_small_vehicle_mae = 1e5
    best_small_vehicle_mse = 1e5
    best_large_vehicle_mae = 1e5
    best_large_vehicle_mse = 1e5
    for epoch in range(args.start_epoch, args.epochs):
        start = time.time()
        adjust_learning_rate(optimizer, epoch)


        # if epoch <= args.max_epoch:
        #     # train(train_pre_load, model, criterion, optimizer, epoch, args,scheduler )
        #     train(train_list, model, criterion, optimizer, epoch, args,scheduler )

        end_train = time.time()
        print("train time ", end_train-start)

        #prec1, visi = validate(test_pre_load, model, args)
        mae, mse, visi = validate(val_list, model, args)

        prec1 = np.mean(mae)
        is_best = prec1 < args.best_pred
        args.best_pred = min(prec1, args.best_pred)
        if is_best:
            best_mse = np.mean(mse)
            best_small_vehicle_mae = mae[0]
            best_small_vehicle_mse = mse[0]
            best_large_vehicle_mae = mae[1]
            best_large_vehicle_mse = mse[1]

        print('*\tbest MAE {mae:.3f} \tbest MSE {mse:.3f}'
              .format(mae=args.best_pred, mse=best_mse))
        print('* small-vehicle_MAE {mae:.3f}  * small-vehicle_MSE {mse:.3f}'.format(mae=best_small_vehicle_mae, mse=best_small_vehicle_mse))
        print('* large-vehicle_MAE {mae:.3f}  * large-vehicle_MSE {mse:.3f}'.format(mae=best_large_vehicle_mae, mse=best_large_vehicle_mse))

        save_checkpoint({
            'epoch': epoch + 1,
            'arch': args.pre,
            'state_dict': model.state_dict(),
            'best_prec1': args.best_pred,
            'optimizer': optimizer.state_dict(),
        }, visi, is_best, args.task_id)
        end_val = time.time()
        print("val time",end_val - end_train)


def crop(d, g):
    g_h, g_w = g.size()[2:4]
    d_h, d_w = d.size()[2:4]

    d1 = d[:, :, abs(int(math.floor((d_h - g_h) / 2.0))):abs(int(math.floor((d_h - g_h) / 2.0))) + g_h,
         abs(int(math.floor((d_w - g_w) / 2.0))):abs(int(math.floor((d_w - g_w) / 2.0))) + g_w]
    return d1


def choose_crop(output, target):
    if (output.size()[2] > target.size()[2]) | (output.size()[3] > target.size()[3]):
        output = crop(output, target)
    if (output.size()[2] > target.size()[2]) | (output.size()[3] > target.size()[3]):
        output = crop(output, target)
    if (output.size()[2] < target.size()[2]) | (output.size()[3] < target.size()[3]):
        target = crop(target, output)
    if (output.size()[2] < target.size()[2]) | (output.size()[3] < target.size()[3]):
        target = crop(target, output)
    return output, target



def gt_transform(pt2d, rate):
    # print(pt2d.shape,rate)
    pt2d = pt2d.data.cpu().numpy()

    density = np.zeros((int(rate * pt2d.shape[0]) + 1, int(rate * pt2d.shape[1]) + 1))
    pts = np.array(list(zip(np.nonzero(pt2d)[1], np.nonzero(pt2d)[0])))

    # print(pts.shape,np.nonzero(pt2d)[1],np.nonzero(pt2d)[0])
    orig = np.zeros((int(rate * pt2d.shape[0]) + 1, int(rate * pt2d.shape[1]) + 1))

    for i, pt in enumerate(pts):
        #    orig = np.zeros((int(rate*pt2d.shape[0])+1,int(rate*pt2d.shape[1])+1),dtype=np.float32)
        orig[int(rate * pt[1]), int(rate * pt[0])] = 1.0
    #    print(pt)

    density += scipy.ndimage.filters.gaussian_filter(orig, 8)

    # density_map = density
    # density_map = density_map / np.max(density_map) * 255
    # density_map = density_map.astype(np.uint8)
    # density_map = cv2.applyColorMap(density_map, 2)
    # cv2.imwrite('./temp/1.jpg', density_map)

    # print(np.sum(density))
    # print(pt2d.sum(),pts.shape, orig.sum(),density.sum())
    return density

def train(Pre_data, model, criterion, optimizer, epoch, args, scheduler):
    losses = AverageMeter()
    batch_time = AverageMeter()
    data_time = AverageMeter()

    train_loader = torch.utils.data.DataLoader(
        dataset.listDataset_dota_class_2(Pre_data, args.task_id,
                            shuffle=True,
                            transform=transforms.Compose([
                                # transforms.Resize((512, 512)),
                                transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                                                            std=[0.229, 0.224, 0.225]),
                            ]),
                            train=True,
                            # seen=model.module.seen,
                            num_workers=args.workers),
        batch_size=args.batch_size, drop_last=False)
    args.lr = optimizer.param_groups[0]['lr']
    print('epoch %d, processed %d samples, lr %.10f' % (epoch, epoch * len(train_loader.dataset), args.lr))

    model.train()
    end = time.time()
    loss_ave = 0.0

    begin_time_test_4=0

    for i, (fname, img, target, kpoint, mask_map) in enumerate(train_loader):

        torch.cuda.synchronize()
        end_time_test_4 = time.time()
        run_time_4 = end_time_test_4 - begin_time_test_4
        # print('该循环程序运行时间4：', run_time_4)

        torch.cuda.synchronize()
        begin_time_test_1 = time.time()

        data_time.update(time.time() - end)
        img = img.cuda()
        # mask_map = mask_map.cuda()
        # img = img * mask_map[0,:,:]
        # target = target  * mask_map[0,:,:]

        torch.cuda.synchronize()
        end_time_test_1 = time.time()
        run_time_1 = end_time_test_1 - begin_time_test_1
        # print('该循环程序运行时间1：', run_time_1)  # 该循环程序运行时间： 1.4201874732

        torch.cuda.synchronize()
        begin_time_test_2 = time.time()

        # if epoch>307:
        #     scale = random.uniform(0.8, 1.3)
        #     img = F.upsample_bilinear(img, scale_factor=scale)
        #     target = torch.from_numpy(gt_transform(target, scale)).unsqueeze(0).type(torch.FloatTensor).cuda()
        #     print(img.shape,target.shape)
        # else:
        density_map_pre_1, density_map_pre_2, mask_pre = model(img, target)

        torch.cuda.synchronize()
        end_time_test_2 = time.time()
        run_time_2 = end_time_test_2 - begin_time_test_2
        # print('该循环程序运行时间2：', run_time_2)  # 该循环程序运行时间： 1.4201874732

        torch.cuda.synchronize()
        begin_time_test_3 = time.time()

        # 'plane', 'ship', 'small_vehicle', 'large_vehicle'
        lamda = args.lamd
        # mask_person_pre = mask_pre[0]
        mask_plane_pre = mask_pre[:, 0:2, :, :]
        mask_ship_pre = mask_pre[:, 2:4, :, :]
        mask_plane_map = torch.unsqueeze(mask_map[0, 0, :, :], 0)
        mask_ship_map = torch.unsqueeze(mask_map[0, 1, :, :], 0)
        loss = criterion[0](density_map_pre_1, target) + criterion[0](density_map_pre_2, target) + \
               lamda * criterion[1](mask_plane_pre, mask_plane_map.long()) + lamda * criterion[1](mask_ship_pre, mask_ship_map.long())

        losses.update(loss.item(), img.size(0))
        optimizer.zero_grad()


        loss.backward()

        optimizer.step()

        torch.cuda.synchronize()
        end_time_test_3 = time.time()
        run_time_3 = end_time_test_3 - begin_time_test_3
        # print('该循环程序运行时间3：', run_time_3)

        batch_time.update(time.time() - end)
        end = time.time()

        torch.cuda.synchronize()
        begin_time_test_4 = time.time()

        if i % args.print_freq == 0:
            print('4_Epoch: [{0}][{1}/{2}]\t'
                  'Time {batch_time.val:.3f} ({batch_time.avg:.3f})\t'
                  'Data {data_time.val:.3f} ({data_time.avg:.3f})\t'
                  'Loss {loss.val:.4f} ({loss.avg:.4f})\t'
                .format(
                epoch, i, len(train_loader), batch_time=batch_time,
                data_time=data_time, loss=losses))
        loss_ave  += loss.item()
    loss_ave = loss_ave*1.0/len(train_loader)

    print(loss_ave, args.lr)
    scheduler.step()

def validate(Pre_data, model, args):
    print ('begin test')
    test_loader = torch.utils.data.DataLoader(
        dataset.listDataset_dota_class_2(Pre_data, args.task_id,
                            shuffle=False,
                            transform=transforms.Compose([
                                transforms.ToTensor(), transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                                                            std=[0.229, 0.224, 0.225]),
                            ]), train=False),)

    model.eval()

    mae = np.array([1.0]*len(VisDrone_category))
    mse = np.array([1.0]*len(VisDrone_category))
    visi = []

    for i, (fname, img, target, kpoint, mask_map)  in enumerate(test_loader):
        torch.set_num_threads(args.workers)

        img = img.cuda()
        # mask_map = mask_map.cuda()
        # img = img * mask_map[0,:,:]
        # target = target  * mask_map[0,:,:]
        with torch.no_grad():
            density_map_pre, _, mask_pre = model(img, target)

        mask_plane = torch.max(F.softmax(mask_pre[0,0:2]), 0, keepdim=True)[1]
        mask_ship = torch.max(F.softmax(mask_pre[0,2:4]), 0, keepdim=True)[1]
        mask_pre = torch.cat((mask_plane, mask_ship), 0)
        mask_pre = torch.unsqueeze(mask_pre, 0)
        density_map_pre = torch.mul(density_map_pre, mask_pre)
        density_map_pre[density_map_pre < 0] = 0

        for idx in range(len(VisDrone_category)):
            count = torch.sum(density_map_pre[:,idx,:,:]).item()
            mae[idx] +=abs(torch.sum(target[:,idx,:,:]).item()  - count)
            mse[idx] +=abs(torch.sum(target[:,idx,:,:]).item()  - count) * abs(torch.sum(target[:,idx,:,:]).item()  - count)

        # if i%50 == 0:
        if i %50 == 0:
            print(i)
            source_img = cv2.imread('./dataset/RSOC/test_data/images/{}'.format(fname[0]))
            feature_test(source_img, mask_map.data.cpu().numpy(), target.data.cpu().numpy(), mask_pre.data.cpu().numpy(), density_map_pre.data.cpu().numpy(),'./vision_map/rsoc_v4_mask_class2_2048/img{}.jpg'.format(str(i)), VisDrone_category)


    mae = mae*1.0 / len(test_loader)
    for idx in range(len(VisDrone_category)):
        mse[idx] = math.sqrt(mse[idx] / len(test_loader))

    #'plane', 'ship', 'small_vehicle', 'large_vehicle'
    print('\n* rsoc_v4_mask_class2_2048', '\targs.gpu_id:',args.gpu_id )
    print('* small-vehicle_MAE{mae:.3f}  * small-vehicle_MSE {mse:.3f}'.format(mae=mae[0], mse=mse[0]))
    print('* large-vehicle_MAE  {mae:.3f}  * large-vehicle_MSE {mse:.3f}'.format(mae=mae[1], mse=mse[1]))
    print('* MAE {mae:.3f}  * MSE {mse:.3f}'.format(mae=np.mean(mae), mse=np.mean(mse)))

    return mae, mse, visi

def adjust_learning_rate(optimizer, epoch):
    """Sets the learning rate to the initial LR decayed by 10 every 30 epochs"""

    # if epoch > 100:
    #     args.lr = 1e-5
    # if epoch > 300:
    #     args.lr = 1e-5


    # for i in range(len(args.steps)):
    #
    #     scale = args.scales[i] if i < len(args.scales) else 1
    #
    #     if epoch >= args.steps[i]:
    #         args.lr = args.lr * scale
    #         if epoch == args.steps[i]:
    #             break
    #     else:
    #         break
    # for param_group in optimizer.param_groups:
    #     param_group['lr'] = args.lr


class AverageMeter(object):
    """Computes and stores the average and current value"""

    def __init__(self):
        self.reset()

    def reset(self):
        self.val = 0
        self.avg = 0
        self.sum = 0
        self.count = 0

    def update(self, val, n=1):
        self.val = val
        self.sum += val * n
        self.count += n
        self.avg = self.sum / self.count

if __name__ == '__main__':
    main()