End of training

Browse files

Files changed (4) hide show

all_results.json +17 -0
eval_results.json +11 -0
train_results.json +9 -0
trainer_state.json +1071 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+    "epoch": 88.0,
+    "eval_cer": 0.1799818016378526,
+    "eval_loss": 0.5572390556335449,
+    "eval_per": 0.3419341731003657,
+    "eval_runtime": 53.0951,
+    "eval_samples": 542,
+    "eval_samples_per_second": 10.208,
+    "eval_steps_per_second": 1.281,
+    "eval_wer": 0.3508736286062576,
+    "total_flos": 1.09964139862412e+19,
+    "train_loss": 1.8723361995313075,
+    "train_runtime": 18047.9219,
+    "train_samples": 448,
+    "train_samples_per_second": 3.723,
+    "train_steps_per_second": 0.116
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+    "epoch": 88.0,
+    "eval_cer": 0.1799818016378526,
+    "eval_loss": 0.5572390556335449,
+    "eval_per": 0.3419341731003657,
+    "eval_runtime": 53.0951,
+    "eval_samples": 542,
+    "eval_samples_per_second": 10.208,
+    "eval_steps_per_second": 1.281,
+    "eval_wer": 0.3508736286062576
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 88.0,
+    "total_flos": 1.09964139862412e+19,
+    "train_loss": 1.8723361995313075,
+    "train_runtime": 18047.9219,
+    "train_samples": 448,
+    "train_samples_per_second": 3.723,
+    "train_steps_per_second": 0.116
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1071 @@

+{
+  "best_metric": 0.5572390556335449,
+  "best_model_checkpoint": "wav2vec2-large-xlsr-coraa-exp-15/checkpoint-952",
+  "epoch": 88.0,
+  "global_step": 1232,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.07,
+      "learning_rate": 0.0,
+      "loss": 38.389,
+      "step": 1
+    },
+    {
+      "epoch": 1.0,
+      "eval_cer": 1.2271883530482257,
+      "eval_loss": 41.37998580932617,
+      "eval_per": 1.2228768793173506,
+      "eval_runtime": 53.5477,
+      "eval_samples_per_second": 10.122,
+      "eval_steps_per_second": 1.27,
+      "eval_wer": 1.223486387647298,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 9.465086936950684,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8283,
+      "eval_samples_per_second": 10.26,
+      "eval_steps_per_second": 1.287,
+      "eval_wer": 1.0,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 4.3683037757873535,
+      "eval_per": 1.0,
+      "eval_runtime": 53.3002,
+      "eval_samples_per_second": 10.169,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 1.0,
+      "step": 42
+    },
+    {
+      "epoch": 4.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.798459768295288,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8553,
+      "eval_samples_per_second": 10.254,
+      "eval_steps_per_second": 1.287,
+      "eval_wer": 1.0,
+      "step": 56
+    },
+    {
+      "epoch": 5.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.5498790740966797,
+      "eval_per": 1.0,
+      "eval_runtime": 52.793,
+      "eval_samples_per_second": 10.267,
+      "eval_steps_per_second": 1.288,
+      "eval_wer": 1.0,
+      "step": 70
+    },
+    {
+      "epoch": 6.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.3330023288726807,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8628,
+      "eval_samples_per_second": 10.253,
+      "eval_steps_per_second": 1.286,
+      "eval_wer": 1.0,
+      "step": 84
+    },
+    {
+      "epoch": 7.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.2144837379455566,
+      "eval_per": 1.0,
+      "eval_runtime": 52.7854,
+      "eval_samples_per_second": 10.268,
+      "eval_steps_per_second": 1.288,
+      "eval_wer": 1.0,
+      "step": 98
+    },
+    {
+      "epoch": 7.14,
+      "learning_rate": 4.9835316313862235e-05,
+      "loss": 11.0275,
+      "step": 100
+    },
+    {
+      "epoch": 8.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.119868516921997,
+      "eval_per": 1.0,
+      "eval_runtime": 53.2825,
+      "eval_samples_per_second": 10.172,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 1.0,
+      "step": 112
+    },
+    {
+      "epoch": 9.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.073655128479004,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8621,
+      "eval_samples_per_second": 10.253,
+      "eval_steps_per_second": 1.286,
+      "eval_wer": 1.0,
+      "step": 126
+    },
+    {
+      "epoch": 10.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.093132972717285,
+      "eval_per": 1.0,
+      "eval_runtime": 53.2164,
+      "eval_samples_per_second": 10.185,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 1.0,
+      "step": 140
+    },
+    {
+      "epoch": 11.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.036287784576416,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8791,
+      "eval_samples_per_second": 10.25,
+      "eval_steps_per_second": 1.286,
+      "eval_wer": 1.0,
+      "step": 154
+    },
+    {
+      "epoch": 12.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.076300621032715,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8593,
+      "eval_samples_per_second": 10.254,
+      "eval_steps_per_second": 1.286,
+      "eval_wer": 1.0,
+      "step": 168
+    },
+    {
+      "epoch": 13.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.0297698974609375,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8617,
+      "eval_samples_per_second": 10.253,
+      "eval_steps_per_second": 1.286,
+      "eval_wer": 1.0,
+      "step": 182
+    },
+    {
+      "epoch": 14.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.006406784057617,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8511,
+      "eval_samples_per_second": 10.255,
+      "eval_steps_per_second": 1.287,
+      "eval_wer": 1.0,
+      "step": 196
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 4.912104887290587e-05,
+      "loss": 2.9809,
+      "step": 200
+    },
+    {
+      "epoch": 15.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.0108399391174316,
+      "eval_per": 1.0,
+      "eval_runtime": 53.3036,
+      "eval_samples_per_second": 10.168,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 1.0,
+      "step": 210
+    },
+    {
+      "epoch": 16.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.004916191101074,
+      "eval_per": 1.0,
+      "eval_runtime": 52.9297,
+      "eval_samples_per_second": 10.24,
+      "eval_steps_per_second": 1.285,
+      "eval_wer": 1.0,
+      "step": 224
+    },
+    {
+      "epoch": 17.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.005828857421875,
+      "eval_per": 1.0,
+      "eval_runtime": 52.9267,
+      "eval_samples_per_second": 10.241,
+      "eval_steps_per_second": 1.285,
+      "eval_wer": 1.0,
+      "step": 238
+    },
+    {
+      "epoch": 18.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.0001630783081055,
+      "eval_per": 1.0,
+      "eval_runtime": 52.9746,
+      "eval_samples_per_second": 10.231,
+      "eval_steps_per_second": 1.284,
+      "eval_wer": 1.0,
+      "step": 252
+    },
+    {
+      "epoch": 19.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 2.9971230030059814,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8982,
+      "eval_samples_per_second": 10.246,
+      "eval_steps_per_second": 1.285,
+      "eval_wer": 1.0,
+      "step": 266
+    },
+    {
+      "epoch": 20.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 3.003479242324829,
+      "eval_per": 1.0,
+      "eval_runtime": 53.0478,
+      "eval_samples_per_second": 10.217,
+      "eval_steps_per_second": 1.282,
+      "eval_wer": 1.0,
+      "step": 280
+    },
+    {
+      "epoch": 21.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 2.997053623199463,
+      "eval_per": 1.0,
+      "eval_runtime": 52.9657,
+      "eval_samples_per_second": 10.233,
+      "eval_steps_per_second": 1.284,
+      "eval_wer": 1.0,
+      "step": 294
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 4.785703756709939e-05,
+      "loss": 2.9263,
+      "step": 300
+    },
+    {
+      "epoch": 22.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 2.9915590286254883,
+      "eval_per": 1.0,
+      "eval_runtime": 53.0083,
+      "eval_samples_per_second": 10.225,
+      "eval_steps_per_second": 1.283,
+      "eval_wer": 1.0,
+      "step": 308
+    },
+    {
+      "epoch": 23.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 2.980001211166382,
+      "eval_per": 1.0,
+      "eval_runtime": 52.9321,
+      "eval_samples_per_second": 10.24,
+      "eval_steps_per_second": 1.285,
+      "eval_wer": 1.0,
+      "step": 322
+    },
+    {
+      "epoch": 24.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 2.963993787765503,
+      "eval_per": 1.0,
+      "eval_runtime": 52.933,
+      "eval_samples_per_second": 10.239,
+      "eval_steps_per_second": 1.285,
+      "eval_wer": 1.0,
+      "step": 336
+    },
+    {
+      "epoch": 25.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 2.8944971561431885,
+      "eval_per": 1.0,
+      "eval_runtime": 52.9301,
+      "eval_samples_per_second": 10.24,
+      "eval_steps_per_second": 1.285,
+      "eval_wer": 1.0,
+      "step": 350
+    },
+    {
+      "epoch": 26.0,
+      "eval_cer": 0.9618562329390354,
+      "eval_loss": 2.7926905155181885,
+      "eval_per": 1.0,
+      "eval_runtime": 52.8998,
+      "eval_samples_per_second": 10.246,
+      "eval_steps_per_second": 1.285,
+      "eval_wer": 1.0,
+      "step": 364
+    },
+    {
+      "epoch": 27.0,
+      "eval_cer": 0.9588717015468607,
+      "eval_loss": 2.6843531131744385,
+      "eval_per": 1.0,
+      "eval_runtime": 53.2997,
+      "eval_samples_per_second": 10.169,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 1.0,
+      "step": 378
+    },
+    {
+      "epoch": 28.0,
+      "eval_cer": 0.8397088262056415,
+      "eval_loss": 2.4282023906707764,
+      "eval_per": 1.0,
+      "eval_runtime": 52.9953,
+      "eval_samples_per_second": 10.227,
+      "eval_steps_per_second": 1.283,
+      "eval_wer": 1.0,
+      "step": 392
+    },
+    {
+      "epoch": 28.57,
+      "learning_rate": 4.607209053261171e-05,
+      "loss": 2.7713,
+      "step": 400
+    },
+    {
+      "epoch": 29.0,
+      "eval_cer": 0.5754686078252957,
+      "eval_loss": 1.9364439249038696,
+      "eval_per": 1.0,
+      "eval_runtime": 53.1836,
+      "eval_samples_per_second": 10.191,
+      "eval_steps_per_second": 1.279,
+      "eval_wer": 1.0,
+      "step": 406
+    },
+    {
+      "epoch": 30.0,
+      "eval_cer": 0.4154686078252957,
+      "eval_loss": 1.4715863466262817,
+      "eval_per": 1.0,
+      "eval_runtime": 53.2869,
+      "eval_samples_per_second": 10.171,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 1.0,
+      "step": 420
+    },
+    {
+      "epoch": 31.0,
+      "eval_cer": 0.3730300272975432,
+      "eval_loss": 1.1548278331756592,
+      "eval_per": 0.9969524583502641,
+      "eval_runtime": 53.2013,
+      "eval_samples_per_second": 10.188,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.9969524583502641,
+      "step": 434
+    },
+    {
+      "epoch": 32.0,
+      "eval_cer": 0.34496815286624205,
+      "eval_loss": 0.9997040629386902,
+      "eval_per": 0.9707436001625356,
+      "eval_runtime": 53.2403,
+      "eval_samples_per_second": 10.18,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.9725721251523771,
+      "step": 448
+    },
+    {
+      "epoch": 33.0,
+      "eval_cer": 0.23508644222020017,
+      "eval_loss": 0.9342811107635498,
+      "eval_per": 0.541446566436408,
+      "eval_runtime": 53.2284,
+      "eval_samples_per_second": 10.183,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.5623730190979277,
+      "step": 462
+    },
+    {
+      "epoch": 34.0,
+      "eval_cer": 0.21634212920837126,
+      "eval_loss": 0.7746574878692627,
+      "eval_per": 0.4695245835026412,
+      "eval_runtime": 53.2327,
+      "eval_samples_per_second": 10.182,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.49329540837058106,
+      "step": 476
+    },
+    {
+      "epoch": 35.0,
+      "eval_cer": 0.20484076433121018,
+      "eval_loss": 0.7340642809867859,
+      "eval_per": 0.4093864282811865,
+      "eval_runtime": 53.1922,
+      "eval_samples_per_second": 10.189,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.43071921982933764,
+      "step": 490
+    },
+    {
+      "epoch": 35.71,
+      "learning_rate": 4.3806888574264495e-05,
+      "loss": 1.1643,
+      "step": 500
+    },
+    {
+      "epoch": 36.0,
+      "eval_cer": 0.19865332120109191,
+      "eval_loss": 0.6946777105331421,
+      "eval_per": 0.391304347826087,
+      "eval_runtime": 53.3183,
+      "eval_samples_per_second": 10.165,
+      "eval_steps_per_second": 1.275,
+      "eval_wer": 0.4101991060544494,
+      "step": 504
+    },
+    {
+      "epoch": 37.0,
+      "eval_cer": 0.20535031847133758,
+      "eval_loss": 0.7270113229751587,
+      "eval_per": 0.40816741162129216,
+      "eval_runtime": 53.28,
+      "eval_samples_per_second": 10.173,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.42726533929297034,
+      "step": 518
+    },
+    {
+      "epoch": 38.0,
+      "eval_cer": 0.19788898999090082,
+      "eval_loss": 0.6677297353744507,
+      "eval_per": 0.3941487200325071,
+      "eval_runtime": 53.3123,
+      "eval_samples_per_second": 10.167,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.40918325883787077,
+      "step": 532
+    },
+    {
+      "epoch": 39.0,
+      "eval_cer": 0.19930846223839854,
+      "eval_loss": 0.6832080483436584,
+      "eval_per": 0.3986184477854531,
+      "eval_runtime": 53.2946,
+      "eval_samples_per_second": 10.17,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.41304347826086957,
+      "step": 546
+    },
+    {
+      "epoch": 40.0,
+      "eval_cer": 0.19777979981801638,
+      "eval_loss": 0.6690617799758911,
+      "eval_per": 0.38459975619666803,
+      "eval_runtime": 53.9829,
+      "eval_samples_per_second": 10.04,
+      "eval_steps_per_second": 1.26,
+      "eval_wer": 0.39943112555871596,
+      "step": 560
+    },
+    {
+      "epoch": 41.0,
+      "eval_cer": 0.1962147406733394,
+      "eval_loss": 0.6585136651992798,
+      "eval_per": 0.3817553839902479,
+      "eval_runtime": 53.1766,
+      "eval_samples_per_second": 10.192,
+      "eval_steps_per_second": 1.279,
+      "eval_wer": 0.3941487200325071,
+      "step": 574
+    },
+    {
+      "epoch": 42.0,
+      "eval_cer": 0.19421292083712466,
+      "eval_loss": 0.6198553442955017,
+      "eval_per": 0.38561560341324663,
+      "eval_runtime": 53.3451,
+      "eval_samples_per_second": 10.16,
+      "eval_steps_per_second": 1.275,
+      "eval_wer": 0.39922795611540024,
+      "step": 588
+    },
+    {
+      "epoch": 42.86,
+      "learning_rate": 4.1113058007555415e-05,
+      "loss": 0.493,
+      "step": 600
+    },
+    {
+      "epoch": 43.0,
+      "eval_cer": 0.19290263876251137,
+      "eval_loss": 0.6267696022987366,
+      "eval_per": 0.3854124339699309,
+      "eval_runtime": 53.2265,
+      "eval_samples_per_second": 10.183,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.39699309223892726,
+      "step": 602
+    },
+    {
+      "epoch": 44.0,
+      "eval_cer": 0.19024567788899,
+      "eval_loss": 0.5925360918045044,
+      "eval_per": 0.36793986184477856,
+      "eval_runtime": 53.2294,
+      "eval_samples_per_second": 10.182,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.3841934173100366,
+      "step": 616
+    },
+    {
+      "epoch": 45.0,
+      "eval_cer": 0.19079162875341218,
+      "eval_loss": 0.6070814728736877,
+      "eval_per": 0.3644859813084112,
+      "eval_runtime": 53.281,
+      "eval_samples_per_second": 10.172,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.3797236895570906,
+      "step": 630
+    },
+    {
+      "epoch": 46.0,
+      "eval_cer": 0.19024567788899,
+      "eval_loss": 0.6036994457244873,
+      "eval_per": 0.36895570906135716,
+      "eval_runtime": 53.2434,
+      "eval_samples_per_second": 10.18,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.38399024786672087,
+      "step": 644
+    },
+    {
+      "epoch": 47.0,
+      "eval_cer": 0.18791628753412193,
+      "eval_loss": 0.5818770527839661,
+      "eval_per": 0.35757822023567654,
+      "eval_runtime": 53.2176,
+      "eval_samples_per_second": 10.185,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.37281592848435596,
+      "step": 658
+    },
+    {
+      "epoch": 48.0,
+      "eval_cer": 0.1861692447679709,
+      "eval_loss": 0.5930420160293579,
+      "eval_per": 0.3508736286062576,
+      "eval_runtime": 53.2097,
+      "eval_samples_per_second": 10.186,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.3671271840715156,
+      "step": 672
+    },
+    {
+      "epoch": 49.0,
+      "eval_cer": 0.19144676979071884,
+      "eval_loss": 0.6291664838790894,
+      "eval_per": 0.3598130841121495,
+      "eval_runtime": 53.8846,
+      "eval_samples_per_second": 10.059,
+      "eval_steps_per_second": 1.262,
+      "eval_wer": 0.3748476229175132,
+      "step": 686
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 3.805199404107583e-05,
+      "loss": 0.3417,
+      "step": 700
+    },
+    {
+      "epoch": 50.0,
+      "eval_cer": 0.19079162875341218,
+      "eval_loss": 0.6297503709793091,
+      "eval_per": 0.3622511174319382,
+      "eval_runtime": 53.2587,
+      "eval_samples_per_second": 10.177,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.37769199512393337,
+      "step": 700
+    },
+    {
+      "epoch": 51.0,
+      "eval_cer": 0.188098271155596,
+      "eval_loss": 0.6183311343193054,
+      "eval_per": 0.3539211702559935,
+      "eval_runtime": 53.3035,
+      "eval_samples_per_second": 10.168,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.36773669240146284,
+      "step": 714
+    },
+    {
+      "epoch": 52.0,
+      "eval_cer": 0.18911737943585077,
+      "eval_loss": 0.6199785470962524,
+      "eval_per": 0.35900040633888664,
+      "eval_runtime": 53.2219,
+      "eval_samples_per_second": 10.184,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.37281592848435596,
+      "step": 728
+    },
+    {
+      "epoch": 53.0,
+      "eval_cer": 0.18831665150136487,
+      "eval_loss": 0.6202276349067688,
+      "eval_per": 0.3539211702559935,
+      "eval_runtime": 53.3713,
+      "eval_samples_per_second": 10.155,
+      "eval_steps_per_second": 1.274,
+      "eval_wer": 0.3681430312880943,
+      "step": 742
+    },
+    {
+      "epoch": 54.0,
+      "eval_cer": 0.18416742493175614,
+      "eval_loss": 0.5682739019393921,
+      "eval_per": 0.3537180008126778,
+      "eval_runtime": 53.1884,
+      "eval_samples_per_second": 10.19,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.36631450629825274,
+      "step": 756
+    },
+    {
+      "epoch": 55.0,
+      "eval_cer": 0.18493175614194723,
+      "eval_loss": 0.5832226276397705,
+      "eval_per": 0.3500609508329947,
+      "eval_runtime": 53.1774,
+      "eval_samples_per_second": 10.192,
+      "eval_steps_per_second": 1.279,
+      "eval_wer": 0.36245428687525394,
+      "step": 770
+    },
+    {
+      "epoch": 56.0,
+      "eval_cer": 0.18456778889899908,
+      "eval_loss": 0.5890292525291443,
+      "eval_per": 0.35290532303941485,
+      "eval_runtime": 53.2119,
+      "eval_samples_per_second": 10.186,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.36550182852498986,
+      "step": 784
+    },
+    {
+      "epoch": 57.0,
+      "eval_cer": 0.1843130118289354,
+      "eval_loss": 0.5770172476768494,
+      "eval_per": 0.3547338480292564,
+      "eval_runtime": 53.3111,
+      "eval_samples_per_second": 10.167,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.36631450629825274,
+      "step": 798
+    },
+    {
+      "epoch": 57.14,
+      "learning_rate": 3.469346151566466e-05,
+      "loss": 0.2811,
+      "step": 800
+    },
+    {
+      "epoch": 58.0,
+      "eval_cer": 0.18438580527752502,
+      "eval_loss": 0.5654671788215637,
+      "eval_per": 0.3488419341731004,
+      "eval_runtime": 53.2322,
+      "eval_samples_per_second": 10.182,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.36062576188541245,
+      "step": 812
+    },
+    {
+      "epoch": 59.0,
+      "eval_cer": 0.18180163785259326,
+      "eval_loss": 0.5697552561759949,
+      "eval_per": 0.34579439252336447,
+      "eval_runtime": 53.2878,
+      "eval_samples_per_second": 10.171,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.35534335635920355,
+      "step": 826
+    },
+    {
+      "epoch": 60.0,
+      "eval_cer": 0.18489535941765242,
+      "eval_loss": 0.5964422225952148,
+      "eval_per": 0.3545306785859407,
+      "eval_runtime": 53.1919,
+      "eval_samples_per_second": 10.19,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.3632669646485169,
+      "step": 840
+    },
+    {
+      "epoch": 61.0,
+      "eval_cer": 0.18591446769790718,
+      "eval_loss": 0.5918516516685486,
+      "eval_per": 0.35331166192604635,
+      "eval_runtime": 53.1841,
+      "eval_samples_per_second": 10.191,
+      "eval_steps_per_second": 1.279,
+      "eval_wer": 0.3608289313287282,
+      "step": 854
+    },
+    {
+      "epoch": 62.0,
+      "eval_cer": 0.18260236578707917,
+      "eval_loss": 0.5771175026893616,
+      "eval_per": 0.34721657862657457,
+      "eval_runtime": 53.2646,
+      "eval_samples_per_second": 10.176,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.3549370174725721,
+      "step": 868
+    },
+    {
+      "epoch": 63.0,
+      "eval_cer": 0.18584167424931755,
+      "eval_loss": 0.6055148243904114,
+      "eval_per": 0.347622917513206,
+      "eval_runtime": 53.2824,
+      "eval_samples_per_second": 10.172,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.3555465258025193,
+      "step": 882
+    },
+    {
+      "epoch": 64.0,
+      "eval_cer": 0.18322111010009098,
+      "eval_loss": 0.5833477973937988,
+      "eval_per": 0.3488419341731004,
+      "eval_runtime": 53.2872,
+      "eval_samples_per_second": 10.171,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.3587972368955709,
+      "step": 896
+    },
+    {
+      "epoch": 64.29,
+      "learning_rate": 3.111400489091288e-05,
+      "loss": 0.2169,
+      "step": 900
+    },
+    {
+      "epoch": 65.0,
+      "eval_cer": 0.1840582347588717,
+      "eval_loss": 0.5863615870475769,
+      "eval_per": 0.3490451036164161,
+      "eval_runtime": 53.2777,
+      "eval_samples_per_second": 10.173,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.35818772856562375,
+      "step": 910
+    },
+    {
+      "epoch": 66.0,
+      "eval_cer": 0.18303912647861692,
+      "eval_loss": 0.5832963585853577,
+      "eval_per": 0.3490451036164161,
+      "eval_runtime": 53.1957,
+      "eval_samples_per_second": 10.189,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.35778138967899226,
+      "step": 924
+    },
+    {
+      "epoch": 67.0,
+      "eval_cer": 0.18111010009099182,
+      "eval_loss": 0.5662943124771118,
+      "eval_per": 0.3441690369768387,
+      "eval_runtime": 53.268,
+      "eval_samples_per_second": 10.175,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.3531084924827306,
+      "step": 938
+    },
+    {
+      "epoch": 68.0,
+      "eval_cer": 0.1799818016378526,
+      "eval_loss": 0.5572390556335449,
+      "eval_per": 0.3419341731003657,
+      "eval_runtime": 53.3033,
+      "eval_samples_per_second": 10.168,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.3508736286062576,
+      "step": 952
+    },
+    {
+      "epoch": 69.0,
+      "eval_cer": 0.1799818016378526,
+      "eval_loss": 0.5641422271728516,
+      "eval_per": 0.34477854530678587,
+      "eval_runtime": 53.2571,
+      "eval_samples_per_second": 10.177,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.35331166192604635,
+      "step": 966
+    },
+    {
+      "epoch": 70.0,
+      "eval_cer": 0.17903548680618744,
+      "eval_loss": 0.5699867010116577,
+      "eval_per": 0.34457537586347015,
+      "eval_runtime": 53.3059,
+      "eval_samples_per_second": 10.168,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.3524989841527834,
+      "step": 980
+    },
+    {
+      "epoch": 71.0,
+      "eval_cer": 0.1813284804367607,
+      "eval_loss": 0.5835239887237549,
+      "eval_per": 0.3468102397399431,
+      "eval_runtime": 53.2775,
+      "eval_samples_per_second": 10.173,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.3549370174725721,
+      "step": 994
+    },
+    {
+      "epoch": 71.43,
+      "learning_rate": 2.739520371708477e-05,
+      "loss": 0.1834,
+      "step": 1000
+    },
+    {
+      "epoch": 72.0,
+      "eval_cer": 0.181073703366697,
+      "eval_loss": 0.5717849135398865,
+      "eval_per": 0.34173100365705,
+      "eval_runtime": 53.2515,
+      "eval_samples_per_second": 10.178,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.349857781389679,
+      "step": 1008
+    },
+    {
+      "epoch": 73.0,
+      "eval_cer": 0.1837306642402184,
+      "eval_loss": 0.5938424468040466,
+      "eval_per": 0.34538805363673303,
+      "eval_runtime": 53.2333,
+      "eval_samples_per_second": 10.182,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.3539211702559935,
+      "step": 1022
+    },
+    {
+      "epoch": 74.0,
+      "eval_cer": 0.1832575068243858,
+      "eval_loss": 0.5955063104629517,
+      "eval_per": 0.3466070702966274,
+      "eval_runtime": 53.2661,
+      "eval_samples_per_second": 10.175,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.35595286468915077,
+      "step": 1036
+    },
+    {
+      "epoch": 75.0,
+      "eval_cer": 0.1819472247497725,
+      "eval_loss": 0.5657592415809631,
+      "eval_per": 0.3437626980902072,
+      "eval_runtime": 53.252,
+      "eval_samples_per_second": 10.178,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.35188947582283625,
+      "step": 1050
+    },
+    {
+      "epoch": 76.0,
+      "eval_cer": 0.18063694267515923,
+      "eval_loss": 0.5671120882034302,
+      "eval_per": 0.3415278342137342,
+      "eval_runtime": 53.2607,
+      "eval_samples_per_second": 10.176,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.34965461194636327,
+      "step": 1064
+    },
+    {
+      "epoch": 77.0,
+      "eval_cer": 0.1827115559599636,
+      "eval_loss": 0.57720947265625,
+      "eval_per": 0.34538805363673303,
+      "eval_runtime": 53.5286,
+      "eval_samples_per_second": 10.125,
+      "eval_steps_per_second": 1.27,
+      "eval_wer": 0.35412433969930923,
+      "step": 1078
+    },
+    {
+      "epoch": 78.0,
+      "eval_cer": 0.18060054595086442,
+      "eval_loss": 0.5743513703346252,
+      "eval_per": 0.3441690369768387,
+      "eval_runtime": 53.3005,
+      "eval_samples_per_second": 10.169,
+      "eval_steps_per_second": 1.276,
+      "eval_wer": 0.35067045916294187,
+      "step": 1092
+    },
+    {
+      "epoch": 78.57,
+      "learning_rate": 2.362181335207052e-05,
+      "loss": 0.1877,
+      "step": 1100
+    },
+    {
+      "epoch": 79.0,
+      "eval_cer": 0.17958143767060963,
+      "eval_loss": 0.572718620300293,
+      "eval_per": 0.3403088175538399,
+      "eval_runtime": 53.2545,
+      "eval_samples_per_second": 10.178,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.347622917513206,
+      "step": 1106
+    },
+    {
+      "epoch": 80.0,
+      "eval_cer": 0.17969062784349407,
+      "eval_loss": 0.5696242451667786,
+      "eval_per": 0.3392929703372613,
+      "eval_runtime": 53.332,
+      "eval_samples_per_second": 10.163,
+      "eval_steps_per_second": 1.275,
+      "eval_wer": 0.3468102397399431,
+      "step": 1120
+    },
+    {
+      "epoch": 81.0,
+      "eval_cer": 0.18045495905368517,
+      "eval_loss": 0.5846197009086609,
+      "eval_per": 0.339496139780577,
+      "eval_runtime": 53.8494,
+      "eval_samples_per_second": 10.065,
+      "eval_steps_per_second": 1.263,
+      "eval_wer": 0.34823242584315317,
+      "step": 1134
+    },
+    {
+      "epoch": 82.0,
+      "eval_cer": 0.17987261146496816,
+      "eval_loss": 0.5943320989608765,
+      "eval_per": 0.34315318976026005,
+      "eval_runtime": 53.1613,
+      "eval_samples_per_second": 10.195,
+      "eval_steps_per_second": 1.279,
+      "eval_wer": 0.35107679804957337,
+      "step": 1148
+    },
+    {
+      "epoch": 83.0,
+      "eval_cer": 0.17907188353048226,
+      "eval_loss": 0.5737566351890564,
+      "eval_per": 0.3388866314506298,
+      "eval_runtime": 53.2154,
+      "eval_samples_per_second": 10.185,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.34559122308004875,
+      "step": 1162
+    },
+    {
+      "epoch": 84.0,
+      "eval_cer": 0.18343949044585986,
+      "eval_loss": 0.6162523031234741,
+      "eval_per": 0.34782608695652173,
+      "eval_runtime": 53.1721,
+      "eval_samples_per_second": 10.193,
+      "eval_steps_per_second": 1.279,
+      "eval_wer": 0.35534335635920355,
+      "step": 1176
+    },
+    {
+      "epoch": 85.0,
+      "eval_cer": 0.18009099181073704,
+      "eval_loss": 0.5756441354751587,
+      "eval_per": 0.34173100365705,
+      "eval_runtime": 53.1881,
+      "eval_samples_per_second": 10.19,
+      "eval_steps_per_second": 1.278,
+      "eval_wer": 0.3488419341731004,
+      "step": 1190
+    },
+    {
+      "epoch": 85.71,
+      "learning_rate": 1.9879833298370238e-05,
+      "loss": 0.1684,
+      "step": 1200
+    },
+    {
+      "epoch": 86.0,
+      "eval_cer": 0.18307552320291173,
+      "eval_loss": 0.620810329914093,
+      "eval_per": 0.34802925639983745,
+      "eval_runtime": 53.2349,
+      "eval_samples_per_second": 10.181,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.3547338480292564,
+      "step": 1204
+    },
+    {
+      "epoch": 87.0,
+      "eval_cer": 0.18114649681528663,
+      "eval_loss": 0.5923516154289246,
+      "eval_per": 0.3413246647704185,
+      "eval_runtime": 53.2706,
+      "eval_samples_per_second": 10.174,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.3484355952864689,
+      "step": 1218
+    },
+    {
+      "epoch": 88.0,
+      "eval_cer": 0.1813284804367607,
+      "eval_loss": 0.5953292846679688,
+      "eval_per": 0.3435595286468915,
+      "eval_runtime": 53.2312,
+      "eval_samples_per_second": 10.182,
+      "eval_steps_per_second": 1.277,
+      "eval_wer": 0.3508736286062576,
+      "step": 1232
+    },
+    {
+      "epoch": 88.0,
+      "step": 1232,
+      "total_flos": 1.09964139862412e+19,
+      "train_loss": 1.8723361995313075,
+      "train_runtime": 18047.9219,
+      "train_samples_per_second": 3.723,
+      "train_steps_per_second": 0.116
+    }
+  ],
+  "max_steps": 2100,
+  "num_train_epochs": 150,
+  "total_flos": 1.09964139862412e+19,
+  "trial_name": null,
+  "trial_params": null
+}