Spaces:

Harry2687
/

Gender-CNN-Demo

Running

App Files Files Community

Harry2687 commited on May 19, 2024

Commit

35b51f6

1 Parent(s): af5e3f0

Added train.py

Browse files

Files changed (4) hide show

.gitignore +4 -1
modules/model.py +68 -0
main.py → predict.py +3 -71
train.py +146 -0

.gitignore CHANGED Viewed

@@ -1,2 +1,5 @@
 model_parameters.pt
-.DS_Store

 model_parameters.pt
+.DS_Store
+modules/__pycache__
+/celeba
+/.vscode

modules/model.py ADDED Viewed

	@@ -0,0 +1,68 @@

+import torch.nn as nn
+import torch.nn.functional as F
+def conv_block(in_channels, out_channels, pool=False):
+    layers = [
+        nn.Conv2d(
+            in_channels,
+            out_channels,
+            kernel_size=3,
+            padding=1
+        ),
+        nn.BatchNorm2d(out_channels),
+        nn.ReLU()
+    ]
+    if pool:
+        layers.append(
+            nn.MaxPool2d(4)
+        )
+    return nn.Sequential(*layers)
+class resnetModel_128(nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.model_name = 'resnetModel_128'
+        self.conv_1 = conv_block(1, 64)
+        self.res_1 = nn.Sequential(
+            conv_block(64, 64),
+            conv_block(64, 64)
+        )
+        self.conv_2 = conv_block(64, 256, pool=True)
+        self.res_2 = nn.Sequential(
+            conv_block(256, 256),
+            conv_block(256, 256)
+        )
+        self.conv_3 = conv_block(256, 512, pool=True)
+        self.res_3 = nn.Sequential(
+            conv_block(512, 512),
+            conv_block(512, 512)
+        )
+        self.conv_4 = conv_block(512, 1024, pool=True)
+        self.res_4 = nn.Sequential(
+            conv_block(1024, 1024),
+            conv_block(1024, 1024)
+        )
+        self.classifier = nn.Sequential(
+            nn.Flatten(),
+            nn.Linear(2*2*1024, 2048),
+            nn.Dropout(0.5),
+            nn.ReLU(),
+            nn.Linear(2048, 1024),
+            nn.Dropout(0.5),
+            nn.ReLU(),
+            nn.Linear(1024, 2)
+        )
+    def forward(self, x):
+        x = self.conv_1(x)
+        x = self.res_1(x) + x
+        x = self.conv_2(x)
+        x = self.res_2(x) + x
+        x = self.conv_3(x)
+        x = self.res_3(x) + x
+        x = self.conv_4(x)
+        x = self.res_4(x) + x
+        x = self.classifier(x)
+        x = F.softmax(x, dim=1)
+        return x

main.py → predict.py RENAMED Viewed

@@ -1,12 +1,11 @@
 import os
 import gdown
 import torch
-import torch.nn as nn
-import torch.nn.functional as F
 import torchvision.datasets as datasets
 import torchvision.transforms as transforms
 from torch.utils.data import DataLoader
 import time
 # Download model if not available
 modelsave_name = 'model_parameters.pt'
@@ -28,76 +27,9 @@ else:
 torch.set_default_device(device)
 print(f'\nDevice: {device_name}')
-# Define model
-def conv_block(in_channels, out_channels, pool=False):
-    layers = [
-        nn.Conv2d(
-            in_channels,
-            out_channels,
-            kernel_size=3,
-            padding=1
-        ),
-        nn.BatchNorm2d(out_channels),
-        nn.ReLU()
-    ]
-    if pool:
-        layers.append(
-            nn.MaxPool2d(4)
-        )
-    return nn.Sequential(*layers)
-class resnetModel_128(nn.Module):
-    def __init__(self):
-        super().__init__()
-        self.model_name = 'resnetModel_128'
-        self.conv_1 = conv_block(1, 64)
-        self.res_1 = nn.Sequential(
-            conv_block(64, 64),
-            conv_block(64, 64)
-        )
-        self.conv_2 = conv_block(64, 256, pool=True)
-        self.res_2 = nn.Sequential(
-            conv_block(256, 256),
-            conv_block(256, 256)
-        )
-        self.conv_3 = conv_block(256, 512, pool=True)
-        self.res_3 = nn.Sequential(
-            conv_block(512, 512),
-            conv_block(512, 512)
-        )
-        self.conv_4 = conv_block(512, 1024, pool=True)
-        self.res_4 = nn.Sequential(
-            conv_block(1024, 1024),
-            conv_block(1024, 1024)
-        )
-        self.classifier = nn.Sequential(
-            nn.Flatten(),
-            nn.Linear(2*2*1024, 2048),
-            nn.Dropout(0.5),
-            nn.ReLU(),
-            nn.Linear(2048, 1024),
-            nn.Dropout(0.5),
-            nn.ReLU(),
-            nn.Linear(1024, 2)
-        )
-    def forward(self, x):
-        x = self.conv_1(x)
-        x = self.res_1(x) + x
-        x = self.conv_2(x)
-        x = self.res_2(x) + x
-        x = self.conv_3(x)
-        x = self.res_3(x) + x
-        x = self.conv_4(x)
-        x = self.res_4(x) + x
-        x = self.classifier(x)
-        x = F.softmax(x, dim=1)
-        return x
 # Make model and load parameters
-resnet = resnetModel_128()
 resnet.load_state_dict(torch.load(modelsave_name, map_location=device))
 resnet.eval()
@@ -118,7 +50,7 @@ my_dataset = datasets.ImageFolder(
 my_dataset_loader = DataLoader(
     my_dataset,
-    batch_size=len(my_dataset),
     generator=torch.Generator(device=device)
 )

 import os
 import gdown
 import torch
 import torchvision.datasets as datasets
 import torchvision.transforms as transforms
 from torch.utils.data import DataLoader
 import time
+import modules.model as model
 # Download model if not available
 modelsave_name = 'model_parameters.pt'
 torch.set_default_device(device)
 print(f'\nDevice: {device_name}')
 # Make model and load parameters
+resnet = model.resnetModel_128()
 resnet.load_state_dict(torch.load(modelsave_name, map_location=device))
 resnet.eval()
 my_dataset_loader = DataLoader(
     my_dataset,
+    batch_size=min(len(my_dataset), 10),
     generator=torch.Generator(device=device)
 )

train.py ADDED Viewed

	@@ -0,0 +1,146 @@

+import os
+import gdown
+import zipfile
+import shutil
+import torch
+import torch.nn as nn
+import torchvision.datasets as datasets
+import torchvision.transforms as transforms
+from torch.utils.data import DataLoader
+import time
+import modules.model as model
+# Download model if not available
+# if os.path.exists('celeba/') == False:
+#     url = 'https://drive.google.com/file/d/1_oL160xwrOiF5x56GddAUtOuXe6bIwpL/view?usp=sharing'
+#     output = 'download.zip'
+#     gdown.download(url, output, fuzzy=True)
+#     with zipfile.ZipFile(output, 'r') as zip_ref:
+#         zip_ref.extractall()
+#     os.remove(output)
+#     shutil.rmtree('__MACOSX')
+# Set device
+if torch.backends.mps.is_available():
+    device = torch.device('mps')
+    device_name = 'Apple Silicon GPU'
+elif torch.cuda.is_available():
+    device = torch.device('cuda')
+    device_name = 'CUDA'
+else:
+    device = torch.device('cpu')
+    device_name = 'CPU'
+torch.set_default_device(device)
+print(f'\nDevice: {device_name}')
+# Define dataset, dataloader and transform
+imsize = int(128/0.8)
+batch_size = 10
+fivecrop_transform = transforms.Compose([
+    transforms.Resize([imsize, imsize]),
+    transforms.Grayscale(1),
+    transforms.FiveCrop(int(imsize*0.8)),
+    transforms.Lambda(lambda crops: torch.stack([transforms.ToTensor()(crop) for crop in crops])),
+    transforms.Normalize(0, 1)
+])
+train_dataset = datasets.CelebA(
+    root='',
+    split='all',
+    target_type='attr',
+    transform=fivecrop_transform,
+    download=True,
+)
+train_loader = DataLoader(
+    train_dataset,
+    batch_size=batch_size,
+    shuffle=True,
+    generator=torch.Generator(device=device)
+)
+# Male index
+factor = 20
+# Define model, optimiser and scheduler
+torch.manual_seed(2687)
+resnet = model.resnetModel_128()
+criterion = nn.CrossEntropyLoss()
+optimizer = torch.optim.SGD(
+    resnet.parameters(),
+    lr=0.01,
+    momentum=0.9,
+    weight_decay=0.001
+)
+scheduler = torch.optim.lr_scheduler.StepLR(
+    optimizer=optimizer,
+    step_size=1,
+    gamma=0.1
+)
+def mins_to_hours(mins):
+    hours = int(mins/60)
+    rem_mins = mins % 60
+    return hours, rem_mins
+epochs = 2
+train_losses = []
+train_accuracy = []
+for i in range(epochs):
+    epoch_time = 0
+    for j, (X_train, y_train) in enumerate(train_loader):
+        batch_start = time.time()
+        X_train = X_train.to(device)
+        y_train = y_train[:, factor]
+        bs, ncrops, c, h, w = X_train.size()
+        y_pred_crops = resnet.forward(X_train.view(-1, c, h, w))
+        y_pred = y_pred_crops.view(bs, ncrops, -1).mean(1)
+        loss = criterion(y_pred, y_train)
+        predicted = torch.max(y_pred.data, 1)[1]
+        train_batch_accuracy = (predicted == y_train).sum()/len(X_train)
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+        train_losses.append(loss.item())
+        train_accuracy.append(train_batch_accuracy.item())
+        batch_end = time.time()
+        batch_time = batch_end - batch_start
+        epoch_time += batch_time
+        avg_batch_time = epoch_time/(j+1)
+        batches_remaining = len(train_loader)-(j+1)
+        epoch_mins_remaining = round(batches_remaining*avg_batch_time/60)
+        epoch_time_remaining = mins_to_hours(epoch_mins_remaining)
+        full_epoch = avg_batch_time*len(train_loader)
+        epochs_remaining = epochs-(i+1)
+        rem_epoch_mins_remaining = epoch_mins_remaining+round(full_epoch*epochs_remaining/60)
+        rem_epoch_time_remaining = mins_to_hours(rem_epoch_mins_remaining)
+        if (j+1) % 10 == 0:
+            print(f'\nEpoch: {i+1}/{epochs} | Train Batch: {j+1}/{len(train_loader)}')
+            print(f'Current epoch: {epoch_time_remaining[0]} hours {epoch_time_remaining[1]} minutes')
+            print(f'Remaining epochs: {rem_epoch_time_remaining[0]} hours {rem_epoch_time_remaining[1]} minutes')
+            print(f'Train Loss: {loss}')
+            print(f'Train Accuracy: {train_batch_accuracy}')
+    scheduler.step()
+    trained_model_name = resnet.model_name + '_epoch_' + str(i+1) + '.pt'
+    torch.save(
+        resnet.state_dict(),
+        trained_model_name
+    )