Training in progress, epoch 24, checkpoint

Browse files

Files changed (12) hide show

checkpoint-1944/config.json +61 -0
checkpoint-1944/merges.txt +0 -0
checkpoint-1944/model.safetensors +3 -0
checkpoint-1944/optimizer.pt +3 -0
checkpoint-1944/rng_state.pth +3 -0
checkpoint-1944/scheduler.pt +3 -0
checkpoint-1944/special_tokens_map.json +15 -0
checkpoint-1944/tokenizer.json +0 -0
checkpoint-1944/tokenizer_config.json +57 -0
checkpoint-1944/trainer_state.json +1554 -0
checkpoint-1944/training_args.bin +3 -0
checkpoint-1944/vocab.json +0 -0

checkpoint-1944/config.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "_name_or_path": "allenai/longformer-base-4096",
+  "architectures": [
+    "LongformerForTokenClassification"
+  ],
+  "attention_mode": "longformer",
+  "attention_probs_dropout_prob": 0.1,
+  "attention_window": [
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700
+  ],
+  "bos_token_id": 0,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-MajorClaim",
+    "2": "I-MajorClaim",
+    "3": "B-Claim",
+    "4": "I-Claim",
+    "5": "B-Premise",
+    "6": "I-Premise"
+  },
+  "ignore_attention_mask": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "B-Claim": 3,
+    "B-MajorClaim": 1,
+    "B-Premise": 5,
+    "I-Claim": 4,
+    "I-MajorClaim": 2,
+    "I-Premise": 6,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 4098,
+  "model_type": "longformer",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "onnx_export": false,
+  "pad_token_id": 1,
+  "sep_token_id": 2,
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "type_vocab_size": 1,
+  "vocab_size": 50265
+}

checkpoint-1944/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1944/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a14de5aabe8a2ce3ab6985e31c42b7040d71a1ee32cedcf34043b699f7fba2db
+size 592330980

checkpoint-1944/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c7b1f7f849e3e31c96dd661e5371b45212c893db6361be8ce2e4b227d7779eb8
+size 1014670074

checkpoint-1944/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6563dd148ba5b581954f95cf442f239370538d2981016fe8e86fa11803fed43e
+size 14244

checkpoint-1944/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dd2f95089404ec23d9559b4f12dbe58d621a93231759b08cfbf583c3ac438b3f
+size 1064

checkpoint-1944/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

checkpoint-1944/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1944/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "add_prefix_space": true,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 4096,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "LongformerTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

checkpoint-1944/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1554 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 24.0,
+  "eval_steps": 500,
+  "global_step": 1944,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_B-Claim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.6820276497695853,
+        "precision": 0.6540404040404041,
+        "recall": 0.7125171939477304,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.43557936284183824,
+        "precision": 0.5235513385293121,
+        "recall": 0.3729181752353367,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.5835814547001276,
+        "precision": 0.5468314069350338,
+        "recall": 0.6256269949840402,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8638885700072705,
+        "precision": 0.8318349299926308,
+        "recall": 0.8985115020297699,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.8838224593742419,
+        "precision": 0.8730234786775275,
+        "recall": 0.8948919449901768,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.7876854942657897,
+      "eval_loss": 0.5461820363998413,
+      "eval_macro avg": {
+        "f1-score": 0.4926999280990091,
+        "precision": 0.4898973654535584,
+        "recall": 0.500637973026722,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0655,
+      "eval_samples_per_second": 15.991,
+      "eval_steps_per_second": 2.172,
+      "eval_weighted avg": {
+        "f1-score": 0.7743853744001297,
+        "precision": 0.7661527277359783,
+        "recall": 0.7876854942657897,
+        "support": 30257.0
+      },
+      "step": 81
+    },
+    {
+      "epoch": 2.0,
+      "eval_B-Claim": {
+        "f1-score": 0.46397188049209137,
+        "precision": 0.48175182481751827,
+        "recall": 0.44745762711864406,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.6402439024390244,
+        "precision": 0.6104651162790697,
+        "recall": 0.6730769230769231,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7515299877600979,
+        "precision": 0.6769570011025359,
+        "recall": 0.844566712517194,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5573419078242231,
+        "precision": 0.5500705218617772,
+        "recall": 0.5648081100651702,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7704582651391162,
+        "precision": 0.6987012987012987,
+        "recall": 0.8586411308709531,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8736837792436597,
+        "precision": 0.9002026342451874,
+        "recall": 0.8486826394969355,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9114385688236163,
+        "precision": 0.9145485115221046,
+        "recall": 0.9083497053045186,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8256932280133523,
+      "eval_loss": 0.4454804062843323,
+      "eval_macro avg": {
+        "f1-score": 0.7098097559602613,
+        "precision": 0.6903852726470703,
+        "recall": 0.7350832640643341,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0817,
+      "eval_samples_per_second": 15.94,
+      "eval_steps_per_second": 2.165,
+      "eval_weighted avg": {
+        "f1-score": 0.8274557458920446,
+        "precision": 0.8315444607100787,
+        "recall": 0.8256932280133523,
+        "support": 30257.0
+      },
+      "step": 162
+    },
+    {
+      "epoch": 3.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5551724137931033,
+        "precision": 0.5649122807017544,
+        "recall": 0.5457627118644067,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7108433734939757,
+        "precision": 0.6704545454545454,
+        "recall": 0.7564102564102564,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7860892388451444,
+        "precision": 0.7515683814303639,
+        "recall": 0.8239339752407153,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5878616796047988,
+        "precision": 0.573296627666896,
+        "recall": 0.6031860970311369,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7989093387866394,
+        "precision": 0.7961956521739131,
+        "recall": 0.801641586867305,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8824656529006482,
+        "precision": 0.9044793581815143,
+        "recall": 0.8614980498288626,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9169814976266588,
+        "precision": 0.9044525128989107,
+        "recall": 0.9298624754420433,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8402683676504611,
+      "eval_loss": 0.41143855452537537,
+      "eval_macro avg": {
+        "f1-score": 0.7483318850072812,
+        "precision": 0.7379084797868425,
+        "recall": 0.7603278789549609,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0654,
+      "eval_samples_per_second": 15.991,
+      "eval_steps_per_second": 2.172,
+      "eval_weighted avg": {
+        "f1-score": 0.8412916372002002,
+        "precision": 0.8430827906594975,
+        "recall": 0.8402683676504611,
+        "support": 30257.0
+      },
+      "step": 243
+    },
+    {
+      "epoch": 4.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5518394648829431,
+        "precision": 0.5445544554455446,
+        "recall": 0.559322033898305,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7048192771084337,
+        "precision": 0.6647727272727273,
+        "recall": 0.75,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.792225201072386,
+        "precision": 0.7725490196078432,
+        "recall": 0.81292984869326,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.577999737153371,
+        "precision": 0.6344489324870167,
+        "recall": 0.5307748008689356,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.800089746466233,
+        "precision": 0.7875441696113075,
+        "recall": 0.8130414956680346,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8919449901768174,
+        "precision": 0.8642131979695431,
+        "recall": 0.9215155615696887,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9180246175312703,
+        "precision": 0.9316273895013655,
+        "recall": 0.9048133595284872,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8475063621641273,
+      "eval_loss": 0.476072758436203,
+      "eval_macro avg": {
+        "f1-score": 0.7481347191987793,
+        "precision": 0.7428156988421926,
+        "recall": 0.7560567286038158,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0796,
+      "eval_samples_per_second": 15.946,
+      "eval_steps_per_second": 2.166,
+      "eval_weighted avg": {
+        "f1-score": 0.8443975745657389,
+        "precision": 0.8435295888400192,
+        "recall": 0.8475063621641273,
+        "support": 30257.0
+      },
+      "step": 324
+    },
+    {
+      "epoch": 5.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5932203389830508,
+        "precision": 0.5932203389830508,
+        "recall": 0.5932203389830508,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7398119122257053,
+        "precision": 0.7239263803680982,
+        "recall": 0.7564102564102564,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7774172615184944,
+        "precision": 0.7358722358722358,
+        "recall": 0.8239339752407153,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5827523883294604,
+        "precision": 0.6264224257563141,
+        "recall": 0.5447743181269611,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.79782711384034,
+        "precision": 0.8275355218030377,
+        "recall": 0.7701778385772914,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8862478777589133,
+        "precision": 0.8792698213726104,
+        "recall": 0.8933375786038367,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9135231488172665,
+        "precision": 0.8963789354259242,
+        "recall": 0.931335952848723,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8441682916349935,
+      "eval_loss": 0.526358962059021,
+      "eval_macro avg": {
+        "f1-score": 0.7558285773533188,
+        "precision": 0.7546608085116101,
+        "recall": 0.7590271798272621,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.076,
+      "eval_samples_per_second": 15.958,
+      "eval_steps_per_second": 2.167,
+      "eval_weighted avg": {
+        "f1-score": 0.841232400970915,
+        "precision": 0.8396195745969204,
+        "recall": 0.8441682916349935,
+        "support": 30257.0
+      },
+      "step": 405
+    },
+    {
+      "epoch": 6.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5809682804674458,
+        "precision": 0.5723684210526315,
+        "recall": 0.5898305084745763,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7402597402597402,
+        "precision": 0.75,
+        "recall": 0.7307692307692307,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7956298200514138,
+        "precision": 0.7466827503015682,
+        "recall": 0.8514442916093535,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.580742605412209,
+        "precision": 0.6067859021567596,
+        "recall": 0.556842867487328,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.798828125,
+        "precision": 0.859695218076721,
+        "recall": 0.7460100319197447,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8905630763194036,
+        "precision": 0.8781922303049063,
+        "recall": 0.9032874313460161,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9183922046285018,
+        "precision": 0.9110681488641856,
+        "recall": 0.9258349705304518,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8468453580989523,
+      "eval_loss": 0.5279645919799805,
+      "eval_macro avg": {
+        "f1-score": 0.7579119788769592,
+        "precision": 0.7606846672509676,
+        "recall": 0.7577170474481001,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0684,
+      "eval_samples_per_second": 15.981,
+      "eval_steps_per_second": 2.17,
+      "eval_weighted avg": {
+        "f1-score": 0.8447801270668736,
+        "precision": 0.8439473640584135,
+        "recall": 0.8468453580989523,
+        "support": 30257.0
+      },
+      "step": 486
+    },
+    {
+      "epoch": 6.17,
+      "grad_norm": 3.7896041870117188,
+      "learning_rate": 1.7530864197530865e-05,
+      "loss": 0.4007,
+      "step": 500
+    },
+    {
+      "epoch": 7.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5654450261780105,
+        "precision": 0.5827338129496403,
+        "recall": 0.5491525423728814,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7454545454545455,
+        "precision": 0.7068965517241379,
+        "recall": 0.7884615384615384,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8080155138978669,
+        "precision": 0.7621951219512195,
+        "recall": 0.859697386519945,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5279187817258884,
+        "precision": 0.6115702479338843,
+        "recall": 0.4643977793869177,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8239801667793555,
+        "precision": 0.8146167557932263,
+        "recall": 0.833561331509348,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8874376008707728,
+        "precision": 0.8396306818181818,
+        "recall": 0.9410172729443604,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.916984006092917,
+        "precision": 0.9490278507619548,
+        "recall": 0.8870333988212181,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8432428859437485,
+      "eval_loss": 0.673554003238678,
+      "eval_macro avg": {
+        "f1-score": 0.7536050915713366,
+        "precision": 0.7523815747046064,
+        "recall": 0.7604744642880299,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0724,
+      "eval_samples_per_second": 15.969,
+      "eval_steps_per_second": 2.169,
+      "eval_weighted avg": {
+        "f1-score": 0.8377716313785262,
+        "precision": 0.8383472270757442,
+        "recall": 0.8432428859437485,
+        "support": 30257.0
+      },
+      "step": 567
+    },
+    {
+      "epoch": 8.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5714285714285714,
+        "precision": 0.554140127388535,
+        "recall": 0.5898305084745763,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7103825136612022,
+        "precision": 0.6190476190476191,
+        "recall": 0.8333333333333334,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7976111479761113,
+        "precision": 0.7705128205128206,
+        "recall": 0.8266850068775791,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5769132977370963,
+        "precision": 0.6094547408004297,
+        "recall": 0.5476707699734492,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7987654320987654,
+        "precision": 0.7277840269966255,
+        "recall": 0.8850889192886456,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8899450117831893,
+        "precision": 0.8784213382957277,
+        "recall": 0.9017750537292049,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9160536128187039,
+        "precision": 0.9404096834264432,
+        "recall": 0.8929273084479371,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8439038900089235,
+      "eval_loss": 0.6914934515953064,
+      "eval_macro avg": {
+        "f1-score": 0.7515856553576629,
+        "precision": 0.7285386223526001,
+        "recall": 0.7824729857321036,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0936,
+      "eval_samples_per_second": 15.902,
+      "eval_steps_per_second": 2.16,
+      "eval_weighted avg": {
+        "f1-score": 0.843008353502502,
+        "precision": 0.8444388009152946,
+        "recall": 0.8439038900089235,
+        "support": 30257.0
+      },
+      "step": 648
+    },
+    {
+      "epoch": 9.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5940246045694201,
+        "precision": 0.6167883211678832,
+        "recall": 0.5728813559322034,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7795527156549521,
+        "precision": 0.7770700636942676,
+        "recall": 0.782051282051282,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8103896103896104,
+        "precision": 0.7675276752767528,
+        "recall": 0.8583218707015131,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.597254004576659,
+        "precision": 0.6309427880741337,
+        "recall": 0.5669804489500362,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8170818505338079,
+        "precision": 0.8516320474777448,
+        "recall": 0.7852257181942545,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8963960457694404,
+        "precision": 0.8770086055898256,
+        "recall": 0.9166600334315053,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9201161588817246,
+        "precision": 0.9220676728815231,
+        "recall": 0.9181728880157171,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8543147040354299,
+      "eval_loss": 0.6210296154022217,
+      "eval_macro avg": {
+        "f1-score": 0.7735449986250879,
+        "precision": 0.7775767391660188,
+        "recall": 0.7714705138966444,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.1135,
+      "eval_samples_per_second": 15.84,
+      "eval_steps_per_second": 2.151,
+      "eval_weighted avg": {
+        "f1-score": 0.8520504540550145,
+        "precision": 0.8509535372864376,
+        "recall": 0.8543147040354299,
+        "support": 30257.0
+      },
+      "step": 729
+    },
+    {
+      "epoch": 10.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6135338345864663,
+        "precision": 0.5513513513513514,
+        "recall": 0.6915254237288135,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7411764705882354,
+        "precision": 0.6847826086956522,
+        "recall": 0.8076923076923077,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7975708502024291,
+        "precision": 0.7827814569536424,
+        "recall": 0.81292984869326,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6205202634810763,
+        "precision": 0.5772746157041961,
+        "recall": 0.6707699734491914,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7967443906731192,
+        "precision": 0.7696557586060349,
+        "recall": 0.8258093935248518,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8895712958099318,
+        "precision": 0.9033316921056951,
+        "recall": 0.876223831887288,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9100379266750948,
+        "precision": 0.9377800937988535,
+        "recall": 0.8838899803536345,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8433420365535248,
+      "eval_loss": 0.7195751070976257,
+      "eval_macro avg": {
+        "f1-score": 0.7670221474309076,
+        "precision": 0.7438510824593465,
+        "recall": 0.7955486799041925,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.1021,
+      "eval_samples_per_second": 15.876,
+      "eval_steps_per_second": 2.156,
+      "eval_weighted avg": {
+        "f1-score": 0.847222004887227,
+        "precision": 0.8531321039459353,
+        "recall": 0.8433420365535248,
+        "support": 30257.0
+      },
+      "step": 810
+    },
+    {
+      "epoch": 11.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6165884194053208,
+        "precision": 0.5726744186046512,
+        "recall": 0.6677966101694915,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7208672086720868,
+        "precision": 0.6244131455399061,
+        "recall": 0.8525641025641025,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8049792531120332,
+        "precision": 0.8094575799721836,
+        "recall": 0.8005502063273727,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6097560975609757,
+        "precision": 0.587642713230356,
+        "recall": 0.6335988414192614,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7834637768412603,
+        "precision": 0.6996415770609319,
+        "recall": 0.8901048791609667,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8909987071751778,
+        "precision": 0.9046681434079908,
+        "recall": 0.8777362095040994,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9085467917829064,
+        "precision": 0.9392763502884112,
+        "recall": 0.8797642436149312,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8418547774068811,
+      "eval_loss": 0.7594641447067261,
+      "eval_macro avg": {
+        "f1-score": 0.7621714649356802,
+        "precision": 0.7339677040149185,
+        "recall": 0.8003021561086037,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.074,
+      "eval_samples_per_second": 15.964,
+      "eval_steps_per_second": 2.168,
+      "eval_weighted avg": {
+        "f1-score": 0.8449795901341711,
+        "precision": 0.8510731379783514,
+        "recall": 0.8418547774068811,
+        "support": 30257.0
+      },
+      "step": 891
+    },
+    {
+      "epoch": 12.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6103448275862069,
+        "precision": 0.6210526315789474,
+        "recall": 0.6,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7815384615384615,
+        "precision": 0.7514792899408284,
+        "recall": 0.8141025641025641,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8209255533199196,
+        "precision": 0.8010471204188482,
+        "recall": 0.8418156808803301,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6016401590457257,
+        "precision": 0.6199743918053777,
+        "recall": 0.5843591600289645,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8330076004343105,
+        "precision": 0.7951907131011609,
+        "recall": 0.8746010031919744,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8897350468031097,
+        "precision": 0.886710411890268,
+        "recall": 0.8927803868502746,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.911568656495334,
+        "precision": 0.9164102054998511,
+        "recall": 0.906777996070727,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8494563241563936,
+      "eval_loss": 0.8027455806732178,
+      "eval_macro avg": {
+        "f1-score": 0.7783943293175811,
+        "precision": 0.7702663948907544,
+        "recall": 0.7877766844464048,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.087,
+      "eval_samples_per_second": 15.923,
+      "eval_steps_per_second": 2.162,
+      "eval_weighted avg": {
+        "f1-score": 0.848586302812254,
+        "precision": 0.8482006969540109,
+        "recall": 0.8494563241563936,
+        "support": 30257.0
+      },
+      "step": 972
+    },
+    {
+      "epoch": 12.35,
+      "grad_norm": 4.786133289337158,
+      "learning_rate": 1.506172839506173e-05,
+      "loss": 0.0725,
+      "step": 1000
+    },
+    {
+      "epoch": 13.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6273187183811131,
+        "precision": 0.6241610738255033,
+        "recall": 0.6305084745762712,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7724550898203593,
+        "precision": 0.7247191011235955,
+        "recall": 0.8269230769230769,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8049620951068229,
+        "precision": 0.8066298342541437,
+        "recall": 0.8033012379642366,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6208425720620842,
+        "precision": 0.6339622641509434,
+        "recall": 0.6082548877624909,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8316106804478898,
+        "precision": 0.7878416972664218,
+        "recall": 0.8805289557683539,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.893793214343142,
+        "precision": 0.9028668886542679,
+        "recall": 0.8849001034784685,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9158942335837642,
+        "precision": 0.9097693351424695,
+        "recall": 0.9221021611001965,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8544799550517236,
+      "eval_loss": 0.8123154044151306,
+      "eval_macro avg": {
+        "f1-score": 0.7809823719635965,
+        "precision": 0.7699928849167635,
+        "recall": 0.7937884139390137,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0805,
+      "eval_samples_per_second": 15.943,
+      "eval_steps_per_second": 2.165,
+      "eval_weighted avg": {
+        "f1-score": 0.8539898174646564,
+        "precision": 0.8540838365486697,
+        "recall": 0.8544799550517236,
+        "support": 30257.0
+      },
+      "step": 1053
+    },
+    {
+      "epoch": 14.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6054421768707484,
+        "precision": 0.6075085324232082,
+        "recall": 0.6033898305084746,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7645259938837919,
+        "precision": 0.7309941520467836,
+        "recall": 0.8012820512820513,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8018995929443691,
+        "precision": 0.7911646586345381,
+        "recall": 0.81292984869326,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5895522388059701,
+        "precision": 0.6081601231716706,
+        "recall": 0.5720492396813903,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8291814946619217,
+        "precision": 0.809379070777247,
+        "recall": 0.8499772001823985,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8850040096230954,
+        "precision": 0.8916538741213541,
+        "recall": 0.8784525989015363,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9117148530195166,
+        "precision": 0.8991307670264591,
+        "recall": 0.924656188605108,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8453250487490498,
+      "eval_loss": 0.8416568040847778,
+      "eval_macro avg": {
+        "f1-score": 0.7696171942584875,
+        "precision": 0.7625701683144658,
+        "recall": 0.7775338511220314,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.1033,
+      "eval_samples_per_second": 15.872,
+      "eval_steps_per_second": 2.155,
+      "eval_weighted avg": {
+        "f1-score": 0.8441459834449434,
+        "precision": 0.8433751308140963,
+        "recall": 0.8453250487490498,
+        "support": 30257.0
+      },
+      "step": 1134
+    },
+    {
+      "epoch": 15.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5912162162162161,
+        "precision": 0.5892255892255892,
+        "recall": 0.5932203389830508,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7435158501440923,
+        "precision": 0.675392670157068,
+        "recall": 0.8269230769230769,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.806833114323259,
+        "precision": 0.7723270440251573,
+        "recall": 0.844566712517194,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5910395607138401,
+        "precision": 0.6118863049095608,
+        "recall": 0.5715664977069757,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7929240374609781,
+        "precision": 0.7293261868300153,
+        "recall": 0.8686730506155951,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8917323614467377,
+        "precision": 0.8876182965299685,
+        "recall": 0.8958847409058346,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9167667066826731,
+        "precision": 0.933958418263351,
+        "recall": 0.900196463654224,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8464157054565885,
+      "eval_loss": 0.8344405293464661,
+      "eval_macro avg": {
+        "f1-score": 0.7620039781411139,
+        "precision": 0.7428192157058158,
+        "recall": 0.7858615544722787,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0958,
+      "eval_samples_per_second": 15.896,
+      "eval_steps_per_second": 2.159,
+      "eval_weighted avg": {
+        "f1-score": 0.8460866237761051,
+        "precision": 0.847207826703169,
+        "recall": 0.8464157054565885,
+        "support": 30257.0
+      },
+      "step": 1215
+    },
+    {
+      "epoch": 16.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6222961730449251,
+        "precision": 0.6111111111111112,
+        "recall": 0.6338983050847458,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7428571428571429,
+        "precision": 0.6701030927835051,
+        "recall": 0.8333333333333334,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8096192384769539,
+        "precision": 0.787012987012987,
+        "recall": 0.8335625859697386,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6160823731306693,
+        "precision": 0.6259028642590286,
+        "recall": 0.6065652908520396,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.791569086651054,
+        "precision": 0.7424121405750799,
+        "recall": 0.8476972184222527,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8906192669900933,
+        "precision": 0.9128363697141902,
+        "recall": 0.869457932022606,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9053283048061116,
+        "precision": 0.891449247762331,
+        "recall": 0.9196463654223969,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8454241993588261,
+      "eval_loss": 0.8837452530860901,
+      "eval_macro avg": {
+        "f1-score": 0.76833879799385,
+        "precision": 0.7486896876026048,
+        "recall": 0.7920230044438733,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.1001,
+      "eval_samples_per_second": 15.882,
+      "eval_steps_per_second": 2.157,
+      "eval_weighted avg": {
+        "f1-score": 0.8454733960648972,
+        "precision": 0.8467830369057293,
+        "recall": 0.8454241993588261,
+        "support": 30257.0
+      },
+      "step": 1296
+    },
+    {
+      "epoch": 17.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5913978494623656,
+        "precision": 0.6273764258555133,
+        "recall": 0.559322033898305,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7801857585139319,
+        "precision": 0.7544910179640718,
+        "recall": 0.8076923076923077,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8131147540983606,
+        "precision": 0.7769423558897243,
+        "recall": 0.8528198074277854,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5990747879722437,
+        "precision": 0.640560593569662,
+        "recall": 0.5626357711803042,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8188068307828787,
+        "precision": 0.7970639032815199,
+        "recall": 0.8417692658458732,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8951778656126482,
+        "precision": 0.8890633587186936,
+        "recall": 0.9013770596195176,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.913778817565921,
+        "precision": 0.9068395085614782,
+        "recall": 0.9208251473477407,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8522325412301286,
+      "eval_loss": 0.9348286986351013,
+      "eval_macro avg": {
+        "f1-score": 0.7730766662869072,
+        "precision": 0.7703338805486661,
+        "recall": 0.7780630561445477,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0975,
+      "eval_samples_per_second": 15.89,
+      "eval_steps_per_second": 2.158,
+      "eval_weighted avg": {
+        "f1-score": 0.8498299198578085,
+        "precision": 0.8484101724875526,
+        "recall": 0.8522325412301286,
+        "support": 30257.0
+      },
+      "step": 1377
+    },
+    {
+      "epoch": 18.0,
+      "eval_B-Claim": {
+        "f1-score": 0.604200323101777,
+        "precision": 0.5771604938271605,
+        "recall": 0.6338983050847458,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7987421383647798,
+        "precision": 0.7839506172839507,
+        "recall": 0.8141025641025641,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8080808080808081,
+        "precision": 0.7915567282321899,
+        "recall": 0.8253094910591472,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.621889400921659,
+        "precision": 0.5948864888692968,
+        "recall": 0.6514602944726043,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8260968401909524,
+        "precision": 0.8236627379873074,
+        "recall": 0.8285453716370269,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8907664941785252,
+        "precision": 0.9050357348229688,
+        "recall": 0.876940221284725,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9170981900675642,
+        "precision": 0.9208675844310191,
+        "recall": 0.9133595284872299,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8508774828965198,
+      "eval_loss": 0.8984508514404297,
+      "eval_macro avg": {
+        "f1-score": 0.7809820278437237,
+        "precision": 0.7710171979219849,
+        "recall": 0.7919451108754348,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0793,
+      "eval_samples_per_second": 15.947,
+      "eval_steps_per_second": 2.166,
+      "eval_weighted avg": {
+        "f1-score": 0.8528669338065401,
+        "precision": 0.8554491006140895,
+        "recall": 0.8508774828965198,
+        "support": 30257.0
+      },
+      "step": 1458
+    },
+    {
+      "epoch": 18.52,
+      "grad_norm": 0.4403069317340851,
+      "learning_rate": 1.2592592592592593e-05,
+      "loss": 0.0254,
+      "step": 1500
+    },
+    {
+      "epoch": 19.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6106346483704975,
+        "precision": 0.6180555555555556,
+        "recall": 0.6033898305084746,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.8,
+        "precision": 0.8051948051948052,
+        "recall": 0.7948717948717948,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8165680473372781,
+        "precision": 0.7821158690176322,
+        "recall": 0.8541953232462174,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6138113874510793,
+        "precision": 0.6434621492853362,
+        "recall": 0.5867728699010379,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.835561810931269,
+        "precision": 0.8603864734299517,
+        "recall": 0.8121295029639762,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8982139352306183,
+        "precision": 0.8860749690210656,
+        "recall": 0.9106901217861976,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9230468176703684,
+        "precision": 0.9194035669038105,
+        "recall": 0.9267190569744598,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8596357867600886,
+      "eval_loss": 0.9286978244781494,
+      "eval_macro avg": {
+        "f1-score": 0.7854052352844444,
+        "precision": 0.7878133412011652,
+        "recall": 0.7841097857503084,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0907,
+      "eval_samples_per_second": 15.912,
+      "eval_steps_per_second": 2.161,
+      "eval_weighted avg": {
+        "f1-score": 0.8578136660426414,
+        "precision": 0.856678268925821,
+        "recall": 0.8596357867600886,
+        "support": 30257.0
+      },
+      "step": 1539
+    },
+    {
+      "epoch": 20.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6073825503355705,
+        "precision": 0.6013289036544851,
+        "recall": 0.6135593220338983,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7801857585139319,
+        "precision": 0.7544910179640718,
+        "recall": 0.8076923076923077,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8281879194630872,
+        "precision": 0.8086500655307994,
+        "recall": 0.8486932599724897,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6063843000869457,
+        "precision": 0.6246161719549642,
+        "recall": 0.5891865797731113,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.814453557969408,
+        "precision": 0.7924935289042278,
+        "recall": 0.8376652986776105,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8983381446516345,
+        "precision": 0.8808813403718154,
+        "recall": 0.9165008357876303,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9182781656537244,
+        "precision": 0.9395621338267036,
+        "recall": 0.8979371316306484,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8545791056614999,
+      "eval_loss": 0.9461593627929688,
+      "eval_macro avg": {
+        "f1-score": 0.7790300566677575,
+        "precision": 0.7717175946010097,
+        "recall": 0.7873192479382423,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.1225,
+      "eval_samples_per_second": 15.813,
+      "eval_steps_per_second": 2.147,
+      "eval_weighted avg": {
+        "f1-score": 0.8538592753289275,
+        "precision": 0.8540159015687182,
+        "recall": 0.8545791056614999,
+        "support": 30257.0
+      },
+      "step": 1620
+    },
+    {
+      "epoch": 21.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6044303797468353,
+        "precision": 0.5667655786350149,
+        "recall": 0.6474576271186441,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7266666666666666,
+        "precision": 0.7569444444444444,
+        "recall": 0.6987179487179487,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8260292164674635,
+        "precision": 0.7984595635430038,
+        "recall": 0.8555708390646493,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5973089860643921,
+        "precision": 0.5945945945945946,
+        "recall": 0.6000482741974414,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7669470559129143,
+        "precision": 0.8382909680908599,
+        "recall": 0.7067943456452348,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.900261137311455,
+        "precision": 0.8820070261188331,
+        "recall": 0.9192867945554406,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9215578716401537,
+        "precision": 0.9358857490124582,
+        "recall": 0.9076620825147348,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8509435833030373,
+      "eval_loss": 0.9814539551734924,
+      "eval_macro avg": {
+        "f1-score": 0.7633144734014116,
+        "precision": 0.7675639892056012,
+        "recall": 0.7622197016877277,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0986,
+      "eval_samples_per_second": 15.887,
+      "eval_steps_per_second": 2.157,
+      "eval_weighted avg": {
+        "f1-score": 0.8507187105998458,
+        "precision": 0.851885777645927,
+        "recall": 0.8509435833030373,
+        "support": 30257.0
+      },
+      "step": 1701
+    },
+    {
+      "epoch": 22.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6473429951690822,
+        "precision": 0.6165644171779141,
+        "recall": 0.6813559322033899,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7711598746081504,
+        "precision": 0.754601226993865,
+        "recall": 0.7884615384615384,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8172043010752689,
+        "precision": 0.7989487516425755,
+        "recall": 0.8363136176066025,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6408852649970879,
+        "precision": 0.6193156235929761,
+        "recall": 0.664011585807386,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8175824175824177,
+        "precision": 0.7891387356809504,
+        "recall": 0.8481532147742818,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8988954970263382,
+        "precision": 0.9140200756952443,
+        "recall": 0.884263312902969,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9192448354255214,
+        "precision": 0.925004973145017,
+        "recall": 0.9135559921414538,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8577188749710811,
+      "eval_loss": 0.9464733004570007,
+      "eval_macro avg": {
+        "f1-score": 0.7874735979834095,
+        "precision": 0.7739419719897916,
+        "recall": 0.8023021705568031,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.1198,
+      "eval_samples_per_second": 15.821,
+      "eval_steps_per_second": 2.149,
+      "eval_weighted avg": {
+        "f1-score": 0.8594459827250006,
+        "precision": 0.8618247265225346,
+        "recall": 0.8577188749710811,
+        "support": 30257.0
+      },
+      "step": 1782
+    },
+    {
+      "epoch": 23.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6166394779771615,
+        "precision": 0.5943396226415094,
+        "recall": 0.6406779661016949,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7781155015197568,
+        "precision": 0.7398843930635838,
+        "recall": 0.8205128205128205,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8206896551724138,
+        "precision": 0.8229598893499308,
+        "recall": 0.8184319119669876,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6299760191846523,
+        "precision": 0.6259232785322849,
+        "recall": 0.634081583393676,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8275272494122675,
+        "precision": 0.7787610619469026,
+        "recall": 0.8828089375284998,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.9005260832898278,
+        "precision": 0.9087372345598963,
+        "recall": 0.8924619915625249,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9158499158499159,
+        "precision": 0.9230692476551586,
+        "recall": 0.9087426326129666,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8572561721254586,
+      "eval_loss": 1.0082058906555176,
+      "eval_macro avg": {
+        "f1-score": 0.7841891289151421,
+        "precision": 0.770524961107038,
+        "recall": 0.7996739776684529,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0733,
+      "eval_samples_per_second": 15.966,
+      "eval_steps_per_second": 2.168,
+      "eval_weighted avg": {
+        "f1-score": 0.8580280687680887,
+        "precision": 0.8594169271331881,
+        "recall": 0.8572561721254586,
+        "support": 30257.0
+      },
+      "step": 1863
+    },
+    {
+      "epoch": 24.0,
+      "eval_B-Claim": {
+        "f1-score": 0.639871382636656,
+        "precision": 0.6085626911314985,
+        "recall": 0.6745762711864407,
+        "support": 295.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7974276527331189,
+        "precision": 0.8,
+        "recall": 0.7948717948717948,
+        "support": 156.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.8280081577158396,
+        "precision": 0.8185483870967742,
+        "recall": 0.8376891334250344,
+        "support": 727.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.632462239271158,
+        "precision": 0.6282448201952846,
+        "recall": 0.6367366642529568,
+        "support": 4143.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8430057803468207,
+        "precision": 0.8550656660412758,
+        "recall": 0.831281349749202,
+        "support": 2193.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.9011940059299623,
+        "precision": 0.9073013311819282,
+        "recall": 0.8951683515083977,
+        "support": 12563.0
+      },
+      "eval_O": {
+        "f1-score": 0.9226263119355627,
+        "precision": 0.9170305676855895,
+        "recall": 0.9282907662082515,
+        "support": 10180.0
+      },
+      "eval_accuracy": 0.8622467528175298,
+      "eval_loss": 0.9314867854118347,
+      "eval_macro avg": {
+        "f1-score": 0.7949422186527312,
+        "precision": 0.7906790661903358,
+        "recall": 0.7998020473145824,
+        "support": 30257.0
+      },
+      "eval_runtime": 5.0984,
+      "eval_samples_per_second": 15.887,
+      "eval_steps_per_second": 2.158,
+      "eval_weighted avg": {
+        "f1-score": 0.862549545162003,
+        "precision": 0.8629799970148593,
+        "recall": 0.8622467528175298,
+        "support": 30257.0
+      },
+      "step": 1944
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 4050,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 50,
+  "save_steps": 500,
+  "total_flos": 3440262177576000.0,
+  "train_batch_size": 4,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1944/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7cf5d4f8fefb4e78449403d6f60739ea086b5ecbb9bc2500c2c1407621dbdb5a
+size 4856

checkpoint-1944/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff