End of training

Browse files

Files changed (4) hide show

all_results.json +16 -0
eval_results.json +10 -0
train_results.json +9 -0
trainer_state.json +375 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+    "epoch": 32.0,
+    "eval_cer": 0.932302092811647,
+    "eval_loss": 8.99256706237793,
+    "eval_runtime": 53.3111,
+    "eval_samples": 542,
+    "eval_samples_per_second": 10.167,
+    "eval_steps_per_second": 1.276,
+    "eval_wer": 0.9865908167411621,
+    "total_flos": 3.9986309695731635e+18,
+    "train_loss": 7.336955785751343,
+    "train_runtime": 6516.6943,
+    "train_samples": 448,
+    "train_samples_per_second": 10.312,
+    "train_steps_per_second": 0.322
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "epoch": 32.0,
+    "eval_cer": 0.932302092811647,
+    "eval_loss": 8.99256706237793,
+    "eval_runtime": 53.3111,
+    "eval_samples": 542,
+    "eval_samples_per_second": 10.167,
+    "eval_steps_per_second": 1.276,
+    "eval_wer": 0.9865908167411621
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 32.0,
+    "total_flos": 3.9986309695731635e+18,
+    "train_loss": 7.336955785751343,
+    "train_runtime": 6516.6943,
+    "train_samples": 448,
+    "train_samples_per_second": 10.312,
+    "train_steps_per_second": 0.322
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,375 @@

+{
+  "best_metric": 8.99256706237793,
+  "best_model_checkpoint": "wav2vec2-large-xlsr-coraa-exp-11/checkpoint-168",
+  "epoch": 32.0,
+  "global_step": 448,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.07,
+      "learning_rate": 3e-05,
+      "loss": 38.5161,
+      "step": 1
+    },
+    {
+      "epoch": 1.0,
+      "eval_cer": 0.9510100090991811,
+      "eval_loss": 34.24892807006836,
+      "eval_runtime": 52.8709,
+      "eval_samples_per_second": 10.251,
+      "eval_steps_per_second": 1.286,
+      "eval_wer": 1.0,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_cer": 0.9510464058234759,
+      "eval_loss": 23.386924743652344,
+      "eval_runtime": 52.734,
+      "eval_samples_per_second": 10.278,
+      "eval_steps_per_second": 1.289,
+      "eval_wer": 1.0,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_cer": 0.9510464058234759,
+      "eval_loss": 19.672130584716797,
+      "eval_runtime": 53.3907,
+      "eval_samples_per_second": 10.152,
+      "eval_steps_per_second": 1.274,
+      "eval_wer": 1.0,
+      "step": 42
+    },
+    {
+      "epoch": 4.0,
+      "eval_cer": 0.9510464058234759,
+      "eval_loss": 18.373493194580078,
+      "eval_runtime": 52.736,
+      "eval_samples_per_second": 10.278,
+      "eval_steps_per_second": 1.289,
+      "eval_wer": 1.0,
+      "step": 56
+    },
+    {
+      "epoch": 5.0,
+      "eval_cer": 0.9495905368516834,
+      "eval_loss": 17.55065155029297,
+      "eval_runtime": 52.7319,
+      "eval_samples_per_second": 10.278,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 1.0026412027631044,
+      "step": 70
+    },
+    {
+      "epoch": 6.0,
+      "eval_cer": 0.9688080072793449,
+      "eval_loss": 16.934043884277344,
+      "eval_runtime": 52.6762,
+      "eval_samples_per_second": 10.289,
+      "eval_steps_per_second": 1.291,
+      "eval_wer": 1.0737505079236083,
+      "step": 84
+    },
+    {
+      "epoch": 7.0,
+      "eval_cer": 0.9511191992720656,
+      "eval_loss": 17.322906494140625,
+      "eval_runtime": 52.7337,
+      "eval_samples_per_second": 10.278,
+      "eval_steps_per_second": 1.289,
+      "eval_wer": 1.0004063388866316,
+      "step": 98
+    },
+    {
+      "epoch": 7.14,
+      "learning_rate": 2.8614285714285714e-05,
+      "loss": 17.5323,
+      "step": 100
+    },
+    {
+      "epoch": 8.0,
+      "eval_cer": 0.9313921747042766,
+      "eval_loss": 16.459413528442383,
+      "eval_runtime": 52.7143,
+      "eval_samples_per_second": 10.282,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 1.0156440471353108,
+      "step": 112
+    },
+    {
+      "epoch": 9.0,
+      "eval_cer": 0.935213830755232,
+      "eval_loss": 12.445086479187012,
+      "eval_runtime": 52.7004,
+      "eval_samples_per_second": 10.285,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 1.0298659081674115,
+      "step": 126
+    },
+    {
+      "epoch": 10.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 10.092220306396484,
+      "eval_runtime": 52.7354,
+      "eval_samples_per_second": 10.278,
+      "eval_steps_per_second": 1.289,
+      "eval_wer": 1.0,
+      "step": 140
+    },
+    {
+      "epoch": 11.0,
+      "eval_cer": 0.9617834394904459,
+      "eval_loss": 9.518609046936035,
+      "eval_runtime": 53.2311,
+      "eval_samples_per_second": 10.182,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.9997968305566842,
+      "step": 154
+    },
+    {
+      "epoch": 12.0,
+      "eval_cer": 0.932302092811647,
+      "eval_loss": 8.99256706237793,
+      "eval_runtime": 52.6632,
+      "eval_samples_per_second": 10.292,
+      "eval_steps_per_second": 1.291,
+      "eval_wer": 0.9865908167411621,
+      "step": 168
+    },
+    {
+      "epoch": 13.0,
+      "eval_cer": 0.9166515013648772,
+      "eval_loss": 9.018474578857422,
+      "eval_runtime": 52.7545,
+      "eval_samples_per_second": 10.274,
+      "eval_steps_per_second": 1.289,
+      "eval_wer": 0.9839496139780577,
+      "step": 182
+    },
+    {
+      "epoch": 14.0,
+      "eval_cer": 0.9216378525932666,
+      "eval_loss": 9.124226570129395,
+      "eval_runtime": 53.3159,
+      "eval_samples_per_second": 10.166,
+      "eval_steps_per_second": 1.275,
+      "eval_wer": 0.983746444534742,
+      "step": 196
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 2.7185714285714287e-05,
+      "loss": 6.6506,
+      "step": 200
+    },
+    {
+      "epoch": 15.0,
+      "eval_cer": 0.8844404003639672,
+      "eval_loss": 9.050068855285645,
+      "eval_runtime": 52.6837,
+      "eval_samples_per_second": 10.288,
+      "eval_steps_per_second": 1.291,
+      "eval_wer": 0.9880130028443722,
+      "step": 210
+    },
+    {
+      "epoch": 16.0,
+      "eval_cer": 0.902238398544131,
+      "eval_loss": 9.189239501953125,
+      "eval_runtime": 52.7185,
+      "eval_samples_per_second": 10.281,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9776513612352702,
+      "step": 224
+    },
+    {
+      "epoch": 17.0,
+      "eval_cer": 0.8847315741583257,
+      "eval_loss": 9.173331260681152,
+      "eval_runtime": 52.733,
+      "eval_samples_per_second": 10.278,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9798862251117432,
+      "step": 238
+    },
+    {
+      "epoch": 18.0,
+      "eval_cer": 0.8733393994540491,
+      "eval_loss": 9.303343772888184,
+      "eval_runtime": 52.7609,
+      "eval_samples_per_second": 10.273,
+      "eval_steps_per_second": 1.289,
+      "eval_wer": 0.9798862251117432,
+      "step": 252
+    },
+    {
+      "epoch": 19.0,
+      "eval_cer": 0.8989626933575978,
+      "eval_loss": 9.28529167175293,
+      "eval_runtime": 52.7177,
+      "eval_samples_per_second": 10.281,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9746038195855343,
+      "step": 266
+    },
+    {
+      "epoch": 20.0,
+      "eval_cer": 0.9086442220200182,
+      "eval_loss": 9.438006401062012,
+      "eval_runtime": 52.8014,
+      "eval_samples_per_second": 10.265,
+      "eval_steps_per_second": 1.288,
+      "eval_wer": 0.9748069890288501,
+      "step": 280
+    },
+    {
+      "epoch": 21.0,
+      "eval_cer": 0.8900090991810737,
+      "eval_loss": 9.513178825378418,
+      "eval_runtime": 52.7023,
+      "eval_samples_per_second": 10.284,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9750101584721658,
+      "step": 294
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 2.5757142857142857e-05,
+      "loss": 3.6568,
+      "step": 300
+    },
+    {
+      "epoch": 22.0,
+      "eval_cer": 0.8811282984531392,
+      "eval_loss": 9.6267728805542,
+      "eval_runtime": 53.0646,
+      "eval_samples_per_second": 10.214,
+      "eval_steps_per_second": 1.281,
+      "eval_wer": 0.9817147501015847,
+      "step": 308
+    },
+    {
+      "epoch": 23.0,
+      "eval_cer": 0.8846587807097361,
+      "eval_loss": 9.698858261108398,
+      "eval_runtime": 52.7263,
+      "eval_samples_per_second": 10.28,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 1.0042665583096302,
+      "step": 322
+    },
+    {
+      "epoch": 24.0,
+      "eval_cer": 0.8963057324840764,
+      "eval_loss": 9.611275672912598,
+      "eval_runtime": 52.7167,
+      "eval_samples_per_second": 10.281,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9788703778951645,
+      "step": 336
+    },
+    {
+      "epoch": 25.0,
+      "eval_cer": 0.8923748862602365,
+      "eval_loss": 9.794692039489746,
+      "eval_runtime": 52.8702,
+      "eval_samples_per_second": 10.252,
+      "eval_steps_per_second": 1.286,
+      "eval_wer": 0.980698902885006,
+      "step": 350
+    },
+    {
+      "epoch": 26.0,
+      "eval_cer": 0.8979435850773431,
+      "eval_loss": 9.83806324005127,
+      "eval_runtime": 52.7321,
+      "eval_samples_per_second": 10.278,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9794798862251117,
+      "step": 364
+    },
+    {
+      "epoch": 27.0,
+      "eval_cer": 0.8951774340309372,
+      "eval_loss": 10.03061580657959,
+      "eval_runtime": 52.6816,
+      "eval_samples_per_second": 10.288,
+      "eval_steps_per_second": 1.291,
+      "eval_wer": 0.9788703778951645,
+      "step": 378
+    },
+    {
+      "epoch": 28.0,
+      "eval_cer": 0.8947042766151047,
+      "eval_loss": 9.994989395141602,
+      "eval_runtime": 53.3774,
+      "eval_samples_per_second": 10.154,
+      "eval_steps_per_second": 1.274,
+      "eval_wer": 0.9792767167817961,
+      "step": 392
+    },
+    {
+      "epoch": 28.57,
+      "learning_rate": 2.432857142857143e-05,
+      "loss": 3.316,
+      "step": 400
+    },
+    {
+      "epoch": 29.0,
+      "eval_cer": 0.8978707916287534,
+      "eval_loss": 10.14880084991455,
+      "eval_runtime": 52.6791,
+      "eval_samples_per_second": 10.289,
+      "eval_steps_per_second": 1.291,
+      "eval_wer": 0.9780577001219016,
+      "step": 406
+    },
+    {
+      "epoch": 30.0,
+      "eval_cer": 0.9092265696087353,
+      "eval_loss": 10.193445205688477,
+      "eval_runtime": 52.6484,
+      "eval_samples_per_second": 10.295,
+      "eval_steps_per_second": 1.292,
+      "eval_wer": 0.9809020723283218,
+      "step": 420
+    },
+    {
+      "epoch": 31.0,
+      "eval_cer": 0.9298999090081893,
+      "eval_loss": 10.21463680267334,
+      "eval_runtime": 52.7062,
+      "eval_samples_per_second": 10.283,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9880130028443722,
+      "step": 434
+    },
+    {
+      "epoch": 32.0,
+      "eval_cer": 0.9593084622383985,
+      "eval_loss": 10.298548698425293,
+      "eval_runtime": 52.7136,
+      "eval_samples_per_second": 10.282,
+      "eval_steps_per_second": 1.29,
+      "eval_wer": 0.9997968305566842,
+      "step": 448
+    },
+    {
+      "epoch": 32.0,
+      "step": 448,
+      "total_flos": 3.9986309695731635e+18,
+      "train_loss": 7.336955785751343,
+      "train_runtime": 6516.6943,
+      "train_samples_per_second": 10.312,
+      "train_steps_per_second": 0.322
+    }
+  ],
+  "max_steps": 2100,
+  "num_train_epochs": 150,
+  "total_flos": 3.9986309695731635e+18,
+  "trial_name": null,
+  "trial_params": null
+}