samil24 commited on Apr 2

Commit

2fa6ee6

verified ·

1 Parent(s): faa8b56

Training in progress, epoch 1

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

model.safetensors +1 -1
run-10/checkpoint-117/config.json +26 -0
run-10/checkpoint-117/model.safetensors +3 -0
run-10/checkpoint-117/optimizer.pt +3 -0
run-10/checkpoint-117/rng_state.pth +3 -0
run-10/checkpoint-117/scheduler.pt +3 -0
run-10/checkpoint-117/special_tokens_map.json +7 -0
run-10/checkpoint-117/tokenizer.json +0 -0
run-10/checkpoint-117/tokenizer_config.json +56 -0
run-10/checkpoint-117/trainer_state.json +65 -0
run-10/checkpoint-117/training_args.bin +3 -0
run-10/checkpoint-117/vocab.txt +0 -0
run-10/checkpoint-39/model.safetensors +1 -1
run-10/checkpoint-39/optimizer.pt +1 -1
run-10/checkpoint-39/scheduler.pt +1 -1
run-10/checkpoint-39/trainer_state.json +10 -10
run-10/checkpoint-39/training_args.bin +1 -1
run-10/checkpoint-78/model.safetensors +1 -1
run-10/checkpoint-78/optimizer.pt +1 -1
run-10/checkpoint-78/scheduler.pt +1 -1
run-10/checkpoint-78/trainer_state.json +14 -14
run-10/checkpoint-78/training_args.bin +1 -1
run-11/checkpoint-39/model.safetensors +1 -1
run-11/checkpoint-39/optimizer.pt +1 -1
run-11/checkpoint-39/scheduler.pt +1 -1
run-11/checkpoint-39/trainer_state.json +10 -10
run-11/checkpoint-39/training_args.bin +1 -1
run-6/checkpoint-78/model.safetensors +1 -1
run-6/checkpoint-78/optimizer.pt +1 -1
run-6/checkpoint-78/scheduler.pt +1 -1
run-6/checkpoint-78/trainer_state.json +16 -16
run-6/checkpoint-78/training_args.bin +1 -1
run-8/checkpoint-39/config.json +26 -0
run-8/checkpoint-39/model.safetensors +3 -0
run-8/checkpoint-39/optimizer.pt +3 -0
run-8/checkpoint-39/rng_state.pth +3 -0
run-8/checkpoint-39/scheduler.pt +3 -0
run-8/checkpoint-39/special_tokens_map.json +7 -0
run-8/checkpoint-39/tokenizer.json +0 -0
run-8/checkpoint-39/tokenizer_config.json +56 -0
run-8/checkpoint-39/trainer_state.json +47 -0
run-8/checkpoint-39/training_args.bin +3 -0
run-8/checkpoint-39/vocab.txt +0 -0
runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596808.80ab07271599.1157.9 +3 -0
runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596828.80ab07271599.1157.10 +3 -0
runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596868.80ab07271599.1157.11 +3 -0
runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596888.80ab07271599.1157.12 +3 -0
runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596968.80ab07271599.1157.13 +3 -0
runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743597008.80ab07271599.1157.14 +3 -0
runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743597833.80ab07271599.1157.15 +3 -0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b014e1a4f3cc837453f8f6fe2122e9cbb3417ddb9c4fca05a47650227d5de336
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:e8b6a21919d34fea94dcddd16a04e049bd1f84af011d7d8a5d8df0ea5c2645b0
 size 437958648

run-10/checkpoint-117/config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.50.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-10/checkpoint-117/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c47ed6122ca7bc8e40bc3598b0017ec8907e46833e5e678991e9ee55c1237a8d
+size 437958648

run-10/checkpoint-117/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e7f28389eb0f6f9c714e496503a34e46bc488f7a9fc16ccdf392735f34113fd7
+size 876038394

run-10/checkpoint-117/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:066817b2001cdf2cab3204d72b7658f8308ed56a8eab94345bd5ce0742b9b7f7
+size 14244

run-10/checkpoint-117/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f7342538ed78d4d8f04eb05b0cb563175fb662d097c0226efb27e3a48d219ce
+size 1064

run-10/checkpoint-117/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-10/checkpoint-117/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-10/checkpoint-117/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-10/checkpoint-117/trainer_state.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "best_global_step": 78,
+  "best_metric": 0.6534296028880866,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-10/checkpoint-78",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 117,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6209386281588448,
+      "eval_loss": 0.6498723030090332,
+      "eval_runtime": 0.6464,
+      "eval_samples_per_second": 428.502,
+      "eval_steps_per_second": 13.922,
+      "step": 39
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6534296028880866,
+      "eval_loss": 0.6439489126205444,
+      "eval_runtime": 0.6414,
+      "eval_samples_per_second": 431.884,
+      "eval_steps_per_second": 14.032,
+      "step": 78
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.6462093862815884,
+      "eval_loss": 0.8346278071403503,
+      "eval_runtime": 0.6444,
+      "eval_samples_per_second": 429.867,
+      "eval_steps_per_second": 13.967,
+      "step": 117
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 585,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 4.267043632502465e-05,
+    "num_train_epochs": 15,
+    "per_device_train_batch_size": 64
+  }
+}

run-10/checkpoint-117/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca59d4c229b54e4a43ebfb084c4a5dae6a76fa9a553c092a64615db9e9ac09fa
+size 5432

run-10/checkpoint-117/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-10/checkpoint-39/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:33eeee34eb19b5a53b8e3f572ead86f2271e5910fe74f758fa8d0ff092e6b391
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:84fc77391ddef8336e458f08bf4093d625e11d76cca6683a0aa411cbc3cc50df
 size 437958648

run-10/checkpoint-39/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:86581670404de085fd9c69dbcf11308c08f5d81a46dfbd9b90b1afb7d2e70869
 size 876038394

 version https://git-lfs.github.com/spec/v1
+oid sha256:ef6a04f1db2026434b43c6e61098b549f30ff5b88fa0bc932c29f3114053f26a
 size 876038394

run-10/checkpoint-39/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:684eb0d3d752752a400036405eee4cb6b7ec612493b362bb0d329494abc59302
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:f529f4fa824518a47ae08c4e1a82b39075bffe8de5663a92b8d6ca71868752b9
 size 1064

run-10/checkpoint-39/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "best_global_step": 39,
-  "best_metric": 0.6245487364620939,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-10/checkpoint-39",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -11,18 +11,18 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6245487364620939,
-      "eval_loss": 0.6695829629898071,
-      "eval_runtime": 0.6396,
-      "eval_samples_per_second": 433.066,
-      "eval_steps_per_second": 14.071,
       "step": 39
     }
   ],
   "logging_steps": 500,
-  "max_steps": 78,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -40,8 +40,8 @@
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 6.997154460264048e-05,
-    "num_train_epochs": 2,
     "per_device_train_batch_size": 64
   }
 }

 {
   "best_global_step": 39,
+  "best_metric": 0.6209386281588448,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-10/checkpoint-39",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6209386281588448,
+      "eval_loss": 0.6498723030090332,
+      "eval_runtime": 0.6464,
+      "eval_samples_per_second": 428.502,
+      "eval_steps_per_second": 13.922,
       "step": 39
     }
   ],
   "logging_steps": 500,
+  "max_steps": 585,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 4.267043632502465e-05,
+    "num_train_epochs": 15,
     "per_device_train_batch_size": 64
   }
 }

run-10/checkpoint-39/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1fc294c6f58e4a3ec49362dc1c2e490491f57d82a68b0d40a70b7dff56d7367
 size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca59d4c229b54e4a43ebfb084c4a5dae6a76fa9a553c092a64615db9e9ac09fa
 size 5432

run-10/checkpoint-78/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8ab82e99ee584d427ac3d22bdf10e582c4e46f81f388a5f641550ba50c03d88b
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:7f7f695c888e8b4447ada63c1486357576f38717e70641c5384fcd14e988fa5f
 size 437958648

run-10/checkpoint-78/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c5d6e72a20bd22fb62367b1f21eb81372b22339a170fa04f159267b3fbad3e8
 size 876038394

 version https://git-lfs.github.com/spec/v1
+oid sha256:5feb162e1c7ddf695561a3dcc5f22133ada525d3248eab2310779fc9768fd8d1
 size 876038394

run-10/checkpoint-78/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9499799bdc32cf2c4700cc8f37e01abdad401afe3dadcd1b7e046f1bf286afbb
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:86637fe2567c83daac0320d69dbffa725366530e20017dd87cdf8631fba49479
 size 1064

run-10/checkpoint-78/trainer_state.json CHANGED Viewed

@@ -11,27 +11,27 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6245487364620939,
-      "eval_loss": 0.6695829629898071,
-      "eval_runtime": 0.6396,
-      "eval_samples_per_second": 433.066,
-      "eval_steps_per_second": 14.071,
       "step": 39
     },
     {
       "epoch": 2.0,
       "eval_accuracy": 0.6534296028880866,
-      "eval_loss": 0.6818255186080933,
-      "eval_runtime": 0.6405,
-      "eval_samples_per_second": 432.454,
-      "eval_steps_per_second": 14.051,
       "step": 78
     }
   ],
   "logging_steps": 500,
-  "max_steps": 78,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -40,7 +40,7 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
@@ -49,8 +49,8 @@
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 6.997154460264048e-05,
-    "num_train_epochs": 2,
     "per_device_train_batch_size": 64
   }
 }

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6209386281588448,
+      "eval_loss": 0.6498723030090332,
+      "eval_runtime": 0.6464,
+      "eval_samples_per_second": 428.502,
+      "eval_steps_per_second": 13.922,
       "step": 39
     },
     {
       "epoch": 2.0,
       "eval_accuracy": 0.6534296028880866,
+      "eval_loss": 0.6439489126205444,
+      "eval_runtime": 0.6414,
+      "eval_samples_per_second": 431.884,
+      "eval_steps_per_second": 14.032,
       "step": 78
     }
   ],
   "logging_steps": 500,
+  "max_steps": 585,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 4.267043632502465e-05,
+    "num_train_epochs": 15,
     "per_device_train_batch_size": 64
   }
 }

run-10/checkpoint-78/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1fc294c6f58e4a3ec49362dc1c2e490491f57d82a68b0d40a70b7dff56d7367
 size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca59d4c229b54e4a43ebfb084c4a5dae6a76fa9a553c092a64615db9e9ac09fa
 size 5432

run-11/checkpoint-39/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:44a3c05303709178b86495805192f65f4ec8d73a95da43768afde0c8bc82b1aa
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd42fc3b3470f245ee25b1a91c24b73c17f7cb4a9e86512bfce15bcf57a02781
 size 437958648

run-11/checkpoint-39/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:35ba8bd3a137e8c256fa83610476b26e6afa00ed9f59a03889c9f9a4de1fe707
 size 876038394

 version https://git-lfs.github.com/spec/v1
+oid sha256:79da32a34ab09addf9391dfc6f66924d99d858eb9c859ead19ce7c83fac90100
 size 876038394

run-11/checkpoint-39/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1465843e756b4dabb451b4d75f771f906f2c5f5e0d01000393acdd4920574819
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:f0c23801a5ddb22ded05ffc9d23b7e52483659cbd731822c0847adb92e8c801f
 size 1064

run-11/checkpoint-39/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "best_global_step": 39,
-  "best_metric": 0.6137184115523465,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-11/checkpoint-39",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -11,18 +11,18 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6137184115523465,
-      "eval_loss": 0.6391859650611877,
-      "eval_runtime": 0.639,
-      "eval_samples_per_second": 433.464,
-      "eval_steps_per_second": 14.084,
       "step": 39
     }
   ],
   "logging_steps": 500,
-  "max_steps": 78,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -40,8 +40,8 @@
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 6.811976645197309e-05,
-    "num_train_epochs": 2,
     "per_device_train_batch_size": 64
   }
 }

 {
   "best_global_step": 39,
+  "best_metric": 0.6173285198555957,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-11/checkpoint-39",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6173285198555957,
+      "eval_loss": 0.6398611664772034,
+      "eval_runtime": 0.6423,
+      "eval_samples_per_second": 431.296,
+      "eval_steps_per_second": 14.013,
       "step": 39
     }
   ],
   "logging_steps": 500,
+  "max_steps": 585,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 6.0322373827171756e-05,
+    "num_train_epochs": 15,
     "per_device_train_batch_size": 64
   }
 }

run-11/checkpoint-39/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2ff331d460bfbfbbb0ce4eb0b36e8bba429624d138721d53eab7c2881cd497cb
 size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b97468c089ba6ff33fc12e4a0700ac465e7cc381a5949bbe5c24c3f27650b69
 size 5432

run-6/checkpoint-78/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1adfd71f163e454ceb956bbad0838ab316ab8b2269186a2de242e86d6f94d079
 size 437958648

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb1ba5c8089724d0d7f4bcf542f63a7e62dd7b03fb7b0815005b3d794e25fd24
 size 437958648

run-6/checkpoint-78/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05aabd77242bc1cf7de112b4c16bf8780e353c056b0f57e4fb10fbe56c199dc1
 size 876038394

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c6827b667b79d074df0df65b191ef0334701a4bd9c6e21bc9f0862c0cb3ac9c
 size 876038394

run-6/checkpoint-78/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c772fc89b86a560c39294f9e99e045616de0628fc50758bbfa4394e73dde68e
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:67bcf98a98ab76470c935b8832145270959789541c75629573da5ffe7cb94209
 size 1064

run-6/checkpoint-78/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "best_global_step": 78,
-  "best_metric": 0.628158844765343,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-6/checkpoint-78",
   "epoch": 2.0,
   "eval_steps": 500,
@@ -11,27 +11,27 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.592057761732852,
-      "eval_loss": 0.6658051609992981,
-      "eval_runtime": 0.6374,
-      "eval_samples_per_second": 434.596,
-      "eval_steps_per_second": 14.12,
       "step": 39
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.628158844765343,
-      "eval_loss": 0.6411819458007812,
-      "eval_runtime": 0.6383,
-      "eval_samples_per_second": 433.967,
-      "eval_steps_per_second": 14.1,
       "step": 78
     }
   ],
   "logging_steps": 500,
-  "max_steps": 78,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -40,7 +40,7 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }
@@ -49,8 +49,8 @@
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 5.112284871578607e-05,
-    "num_train_epochs": 2,
     "per_device_train_batch_size": 64
   }
 }

 {
   "best_global_step": 78,
+  "best_metric": 0.6389891696750902,
   "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-6/checkpoint-78",
   "epoch": 2.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6101083032490975,
+      "eval_loss": 0.6483533978462219,
+      "eval_runtime": 0.6678,
+      "eval_samples_per_second": 414.792,
+      "eval_steps_per_second": 13.477,
       "step": 39
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.6389891696750902,
+      "eval_loss": 0.6526868343353271,
+      "eval_runtime": 0.6398,
+      "eval_samples_per_second": 432.973,
+      "eval_steps_per_second": 14.068,
       "step": 78
     }
   ],
   "logging_steps": 500,
+  "max_steps": 585,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 4.797258707523021e-05,
+    "num_train_epochs": 15,
     "per_device_train_batch_size": 64
   }
 }

run-6/checkpoint-78/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b1817587903d4ced2975425ce78928c60729b26defe27d7acb18264dbabe1562
 size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:f932c25ae644f210e4526f3c1be14c7f7fe52253969f112e7a5e335bb77ad857
 size 5432

run-8/checkpoint-39/config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.50.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-8/checkpoint-39/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c9e956b4a26c697b232b9334cd775e3b51aed9bce2573b1e76f7dae5e4a7c6b
+size 437958648

run-8/checkpoint-39/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:820a37fdd0077c3ce86d9024cd6fb7e3a34fae69f7d9c28732ed25e4912cfd8a
+size 876038394

run-8/checkpoint-39/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ce2001d6c41d462c4a530df5214c4ba6ac04088f8883ec9b91629a00a7da50d
+size 14244

run-8/checkpoint-39/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19d792f52af224ccafbcd7e21651118681b90d6c9cc69043551847eddb44485b
+size 1064

run-8/checkpoint-39/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-39/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-8/checkpoint-39/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-39/trainer_state.json ADDED Viewed

	@@ -0,0 +1,47 @@

+{
+  "best_global_step": 39,
+  "best_metric": 0.6064981949458483,
+  "best_model_checkpoint": "bert-base-uncased-finetuned-rte-run_3/run-8/checkpoint-39",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 39,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6064981949458483,
+      "eval_loss": 0.6455614566802979,
+      "eval_runtime": 0.6414,
+      "eval_samples_per_second": 431.878,
+      "eval_steps_per_second": 14.032,
+      "step": 39
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 585,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 5.2838273651328355e-05,
+    "num_train_epochs": 15,
+    "per_device_train_batch_size": 64
+  }
+}

run-8/checkpoint-39/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f9c40a0916e7974092f2fa779ef8cfb9240339680ff02e53018c1dfa9048c25
+size 5432

run-8/checkpoint-39/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596808.80ab07271599.1157.9 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c74dcbf62988c7e22aa412f5aadb89285e05980607425d5d45967f0d31e712d3
+size 5419

runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596828.80ab07271599.1157.10 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3049f8b858ee598753195ed39772875c6763010b29b910e463557107d00c9c70
+size 5737

runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596868.80ab07271599.1157.11 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f21ea402050781a5fc1e7205739b21548beae7a910ff5daf3569700937f263bf
+size 5420

runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596888.80ab07271599.1157.12 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a4e162a963f306eddcb3d58edc4ef38e2e8c39d7a3b3163435aa9d3eefb6bb8a
+size 6376

runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743596968.80ab07271599.1157.13 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:26ab4deaa4cec5d624e1c37c96a35688c766f834c40ca99e777ed48ccee10e77
+size 5737

runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743597008.80ab07271599.1157.14 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:123613b55c16fb967f3fe157b40416f8dfb382adfc6cb8550d6fce811f02dfd9
+size 10494

runs/Apr02_11-23-36_80ab07271599/events.out.tfevents.1743597833.80ab07271599.1157.15 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:618b5e99bf134c50583c5eeeb277df0fd50f4c888a066e9c2c6cc8bd4aaeabd7
+size 10494