Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

config.json +83 -0
model.safetensors +3 -0
optimizer.pt +3 -0
preprocessor_config.json +22 -0
scheduler.pt +3 -0
trainer_state.json +144 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,83 @@

+{
+  "_name_or_path": "microsoft/swinv2-base-patch4-window12-192-22k",
+  "architectures": [
+    "Swinv2ForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "depths": [
+    2,
+    2,
+    18,
+    2
+  ],
+  "drop_path_rate": 0.1,
+  "embed_dim": 128,
+  "encoder_stride": 32,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "airplane",
+    "1": "automobile",
+    "2": "bird",
+    "3": "cat",
+    "4": "deer",
+    "5": "dog",
+    "6": "frog",
+    "7": "horse",
+    "8": "ship",
+    "9": "truck"
+  },
+  "image_size": 192,
+  "initializer_range": 0.02,
+  "label2id": {
+    "airplane": 0,
+    "automobile": 1,
+    "bird": 2,
+    "cat": 3,
+    "deer": 4,
+    "dog": 5,
+    "frog": 6,
+    "horse": 7,
+    "ship": 8,
+    "truck": 9
+  },
+  "layer_norm_eps": 1e-05,
+  "mlp_ratio": 4.0,
+  "model_type": "swinv2",
+  "num_channels": 3,
+  "num_heads": [
+    4,
+    8,
+    16,
+    32
+  ],
+  "num_layers": 4,
+  "out_features": [
+    "stage4"
+  ],
+  "out_indices": [
+    4
+  ],
+  "patch_size": 4,
+  "path_norm": true,
+  "pretrained_window_sizes": [
+    0,
+    0,
+    0,
+    0
+  ],
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "use_absolute_embeddings": false,
+  "window_size": 12
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7858d656961fff63d205361d476c2766759f13f4bdda1779971ac07bc2c7f9f7
+size 347678296

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ceca17f37da15c8bdd048a880190680d886ebad6dd88a277b3f5640808b5d8ce
+size 695628200

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 192,
+    "width": 192
+  }
+}

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d2267cb109233cd22562f334600534feee77ed84ae92bc4c4723ba95cecc34f
+size 627

trainer_state.json ADDED Viewed

	@@ -0,0 +1,144 @@

+{
+  "best_metric": 0.9917,
+  "best_model_checkpoint": "test-cifar10-swin-v2-b/checkpoint-5474",
+  "epoch": 7.0,
+  "eval_steps": 500,
+  "global_step": 5474,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.8173182316404826e-05,
+      "loss": 0.4326,
+      "step": 500
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9866,
+      "eval_loss": 0.037221185863018036,
+      "eval_runtime": 62.6309,
+      "eval_samples_per_second": 159.666,
+      "eval_steps_per_second": 2.507,
+      "step": 782
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 1.6346364632809646e-05,
+      "loss": 0.2807,
+      "step": 1000
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 1.4519546949214468e-05,
+      "loss": 0.255,
+      "step": 1500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9892,
+      "eval_loss": 0.03633560240268707,
+      "eval_runtime": 71.9925,
+      "eval_samples_per_second": 138.903,
+      "eval_steps_per_second": 2.181,
+      "step": 1564
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 1.2692729265619292e-05,
+      "loss": 0.2324,
+      "step": 2000
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9892,
+      "eval_loss": 0.03683481737971306,
+      "eval_runtime": 58.8888,
+      "eval_samples_per_second": 169.812,
+      "eval_steps_per_second": 2.666,
+      "step": 2346
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 1.0865911582024116e-05,
+      "loss": 0.2141,
+      "step": 2500
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 9.039093898428938e-06,
+      "loss": 0.2017,
+      "step": 3000
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9906,
+      "eval_loss": 0.029683364555239677,
+      "eval_runtime": 52.3209,
+      "eval_samples_per_second": 191.128,
+      "eval_steps_per_second": 3.001,
+      "step": 3128
+    },
+    {
+      "epoch": 4.48,
+      "learning_rate": 7.21227621483376e-06,
+      "loss": 0.1889,
+      "step": 3500
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9909,
+      "eval_loss": 0.03135338053107262,
+      "eval_runtime": 47.5825,
+      "eval_samples_per_second": 210.161,
+      "eval_steps_per_second": 3.3,
+      "step": 3910
+    },
+    {
+      "epoch": 5.12,
+      "learning_rate": 5.385458531238583e-06,
+      "loss": 0.1828,
+      "step": 4000
+    },
+    {
+      "epoch": 5.75,
+      "learning_rate": 3.5586408476434055e-06,
+      "loss": 0.1745,
+      "step": 4500
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9915,
+      "eval_loss": 0.028573090210556984,
+      "eval_runtime": 46.095,
+      "eval_samples_per_second": 216.943,
+      "eval_steps_per_second": 3.406,
+      "step": 4692
+    },
+    {
+      "epoch": 6.39,
+      "learning_rate": 1.731823164048228e-06,
+      "loss": 0.1713,
+      "step": 5000
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.9917,
+      "eval_loss": 0.028369426727294922,
+      "eval_runtime": 49.7733,
+      "eval_samples_per_second": 200.911,
+      "eval_steps_per_second": 3.154,
+      "step": 5474
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 5474,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 7,
+  "save_steps": 500,
+  "total_flos": 2.01828783808512e+19,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a98e3b09d0d57840affb69aafd6ddfe954e565beac8a146a11cff607bcb56852
+size 4219