Training in progress, epoch 12, checkpoint

Browse files

Files changed (12) hide show

checkpoint-492/config.json +61 -0
checkpoint-492/merges.txt +0 -0
checkpoint-492/model.safetensors +3 -0
checkpoint-492/optimizer.pt +3 -0
checkpoint-492/rng_state.pth +3 -0
checkpoint-492/scheduler.pt +3 -0
checkpoint-492/special_tokens_map.json +15 -0
checkpoint-492/tokenizer.json +0 -0
checkpoint-492/tokenizer_config.json +57 -0
checkpoint-492/trainer_state.json +777 -0
checkpoint-492/training_args.bin +3 -0
checkpoint-492/vocab.json +0 -0

checkpoint-492/config.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "_name_or_path": "allenai/longformer-base-4096",
+  "architectures": [
+    "LongformerForTokenClassification"
+  ],
+  "attention_mode": "longformer",
+  "attention_probs_dropout_prob": 0.1,
+  "attention_window": [
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700
+  ],
+  "bos_token_id": 0,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-MajorClaim",
+    "2": "I-MajorClaim",
+    "3": "B-Claim",
+    "4": "I-Claim",
+    "5": "B-Premise",
+    "6": "I-Premise"
+  },
+  "ignore_attention_mask": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "B-Claim": 3,
+    "B-MajorClaim": 1,
+    "B-Premise": 5,
+    "I-Claim": 4,
+    "I-MajorClaim": 2,
+    "I-Premise": 6,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 4098,
+  "model_type": "longformer",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "onnx_export": false,
+  "pad_token_id": 1,
+  "sep_token_id": 2,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "type_vocab_size": 1,
+  "vocab_size": 50265
+}

checkpoint-492/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-492/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c105cfd77f76a0ed82093cb4a84ea938929f97b1b57b67f84058683eb29cc998
+size 592330980

checkpoint-492/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77a7f245b3805ea480c62b85da4a37a54143c52941086d7c7b7da9c4cf9fb43e
+size 1014670074

checkpoint-492/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b6e53e706c63ba0c275c9b6332ceadb76c337b40858f3ddadb0ab10622a334eb
+size 14244

checkpoint-492/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4e40ce765a2db50b61afa20f73544a6db3531a7c20a21e8ebd94c0459daeb642
+size 1064

checkpoint-492/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

checkpoint-492/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-492/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "add_prefix_space": true,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 4096,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "LongformerTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

checkpoint-492/trainer_state.json ADDED Viewed

	@@ -0,0 +1,777 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 12.0,
+  "eval_steps": 500,
+  "global_step": 492,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_B-Claim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.22426470588235295,
+        "precision": 0.8299319727891157,
+        "recall": 0.12964930924548354,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.38247663551401867,
+        "precision": 0.423873640600725,
+        "recall": 0.348446147296722,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.3634627625716104,
+        "precision": 0.5125673249551167,
+        "recall": 0.28155818540433925,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8298935191271198,
+        "precision": 0.8110747093209996,
+        "recall": 0.8496063521970257,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.8121805609242796,
+        "precision": 0.7380952380952381,
+        "recall": 0.9027976701995608,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.7286865671641791,
+      "eval_loss": 0.763540506362915,
+      "eval_macro avg": {
+        "f1-score": 0.3731825977170545,
+        "precision": 0.47364898368017067,
+        "recall": 0.3588653806204473,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4539,
+      "eval_samples_per_second": 55.714,
+      "eval_steps_per_second": 7.566,
+      "eval_weighted avg": {
+        "f1-score": 0.7040007584084623,
+        "precision": 0.7043362259324342,
+        "recall": 0.7286865671641791,
+        "support": 33500.0
+      },
+      "step": 41
+    },
+    {
+      "epoch": 2.0,
+      "eval_B-Claim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.6669691470054446,
+        "precision": 0.5819477434679335,
+        "recall": 0.7810839532412327,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.48473144236572113,
+        "precision": 0.559799275160301,
+        "recall": 0.4274159216687952,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.6472849591542528,
+        "precision": 0.6312089971883786,
+        "recall": 0.6642011834319527,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8676829461540899,
+        "precision": 0.8200934579439252,
+        "recall": 0.9211358589596932,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.8814110459673844,
+        "precision": 0.9105252442996743,
+        "recall": 0.8541010216747827,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.7977313432835821,
+      "eval_loss": 0.558718204498291,
+      "eval_macro avg": {
+        "f1-score": 0.506868505806699,
+        "precision": 0.5005106740086018,
+        "recall": 0.5211339912823509,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4491,
+      "eval_samples_per_second": 55.895,
+      "eval_steps_per_second": 7.591,
+      "eval_weighted avg": {
+        "f1-score": 0.7863652038192075,
+        "precision": 0.7815218337211824,
+        "recall": 0.7977313432835821,
+        "support": 33500.0
+      },
+      "step": 82
+    },
+    {
+      "epoch": 3.0,
+      "eval_B-Claim": {
+        "f1-score": 0.29174664107485604,
+        "precision": 0.4175824175824176,
+        "recall": 0.22418879056047197,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.1694915254237288,
+        "precision": 0.8823529411764706,
+        "recall": 0.09375,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.731958762886598,
+        "precision": 0.6546521374685667,
+        "recall": 0.8299681190223167,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.45169213973799127,
+        "precision": 0.629277566539924,
+        "recall": 0.35227756492124307,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7669586983729662,
+        "precision": 0.7788510421962379,
+        "recall": 0.7554240631163708,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8619200734956362,
+        "precision": 0.7908845678318535,
+        "recall": 0.9469753044882578,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.8982664685487864,
+        "precision": 0.9332098384274982,
+        "recall": 0.8658455074954645,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8119402985074626,
+      "eval_loss": 0.5103888511657715,
+      "eval_macro avg": {
+        "f1-score": 0.5960049013629376,
+        "precision": 0.7266872158889954,
+        "recall": 0.5812041928005893,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4566,
+      "eval_samples_per_second": 55.611,
+      "eval_steps_per_second": 7.552,
+      "eval_weighted avg": {
+        "f1-score": 0.7972768597429257,
+        "precision": 0.804819781883149,
+        "recall": 0.8119402985074626,
+        "support": 33500.0
+      },
+      "step": 123
+    },
+    {
+      "epoch": 4.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5957446808510639,
+        "precision": 0.6144200626959248,
+        "recall": 0.5781710914454278,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7210884353741497,
+        "precision": 0.7910447761194029,
+        "recall": 0.6625,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7832738398776133,
+        "precision": 0.7529411764705882,
+        "recall": 0.8161530286928799,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6127179923436835,
+        "precision": 0.6121971950701233,
+        "recall": 0.6132396764580673,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8112728112728113,
+        "precision": 0.7631464580617123,
+        "recall": 0.8658777120315582,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8727813651577132,
+        "precision": 0.8770213344204376,
+        "recall": 0.8685821950070655,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9022382671480144,
+        "precision": 0.9097262667443214,
+        "recall": 0.8948725293612145,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8354328358208956,
+      "eval_loss": 0.4638007879257202,
+      "eval_macro avg": {
+        "f1-score": 0.7570167702892928,
+        "precision": 0.7600710385117873,
+        "recall": 0.7570566047137447,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4488,
+      "eval_samples_per_second": 55.909,
+      "eval_steps_per_second": 7.593,
+      "eval_weighted avg": {
+        "f1-score": 0.8357536689114934,
+        "precision": 0.8366601162482339,
+        "recall": 0.8354328358208956,
+        "support": 33500.0
+      },
+      "step": 164
+    },
+    {
+      "epoch": 5.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5777777777777778,
+        "precision": 0.6254295532646048,
+        "recall": 0.5368731563421829,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7753846153846152,
+        "precision": 0.7636363636363637,
+        "recall": 0.7875,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7803692905733722,
+        "precision": 0.7188898836168308,
+        "recall": 0.8533475026567482,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5902196060674665,
+        "precision": 0.6303191489361702,
+        "recall": 0.5549169859514687,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8467858869018849,
+        "precision": 0.8303317535545024,
+        "recall": 0.863905325443787,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8742343541944074,
+        "precision": 0.8650767507740957,
+        "recall": 0.8835879146759976,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9062216924910609,
+        "precision": 0.904970481812988,
+        "recall": 0.9074763678029218,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8389552238805971,
+      "eval_loss": 0.49385663866996765,
+      "eval_macro avg": {
+        "f1-score": 0.7644276033415122,
+        "precision": 0.7626648479422222,
+        "recall": 0.7696581789818724,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4492,
+      "eval_samples_per_second": 55.893,
+      "eval_steps_per_second": 7.59,
+      "eval_weighted avg": {
+        "f1-score": 0.8366342005564686,
+        "precision": 0.8355072066989216,
+        "recall": 0.8389552238805971,
+        "support": 33500.0
+      },
+      "step": 205
+    },
+    {
+      "epoch": 6.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5768621236133122,
+        "precision": 0.6232876712328768,
+        "recall": 0.5368731563421829,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7721518987341772,
+        "precision": 0.782051282051282,
+        "recall": 0.7625,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7921882824236354,
+        "precision": 0.7490530303030303,
+        "recall": 0.8405951115834219,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6107428571428571,
+        "precision": 0.6594274432379073,
+        "recall": 0.5687526607066837,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8353552859618717,
+        "precision": 0.8388861263053208,
+        "recall": 0.8318540433925049,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8799789494457783,
+        "precision": 0.8607000386050702,
+        "recall": 0.9001413094677343,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.912864263803681,
+        "precision": 0.9164661726494081,
+        "recall": 0.9092905566695312,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8463880597014926,
+      "eval_loss": 0.49789243936538696,
+      "eval_macro avg": {
+        "f1-score": 0.7685919515893305,
+        "precision": 0.7756959663406994,
+        "recall": 0.7642866911660084,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4655,
+      "eval_samples_per_second": 55.27,
+      "eval_steps_per_second": 7.506,
+      "eval_weighted avg": {
+        "f1-score": 0.843752680680015,
+        "precision": 0.8426730244638024,
+        "recall": 0.8463880597014926,
+        "support": 33500.0
+      },
+      "step": 246
+    },
+    {
+      "epoch": 7.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5829307568438002,
+        "precision": 0.6418439716312057,
+        "recall": 0.5339233038348082,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.8083832335329341,
+        "precision": 0.7758620689655172,
+        "recall": 0.84375,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7938931297709925,
+        "precision": 0.7203463203463204,
+        "recall": 0.8841657810839533,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.560838445807771,
+        "precision": 0.7018554062699937,
+        "recall": 0.4670072371221797,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8591447209470888,
+        "precision": 0.8422548555187115,
+        "recall": 0.8767258382642998,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.882233502538071,
+        "precision": 0.834623927006423,
+        "recall": 0.9356032568467801,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9121469754715138,
+        "precision": 0.9340538376863805,
+        "recall": 0.8912441516279958,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8465074626865672,
+      "eval_loss": 0.5638343691825867,
+      "eval_macro avg": {
+        "f1-score": 0.7713672521303102,
+        "precision": 0.7786914839177931,
+        "recall": 0.7760599383971453,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4511,
+      "eval_samples_per_second": 55.818,
+      "eval_steps_per_second": 7.58,
+      "eval_weighted avg": {
+        "f1-score": 0.8392525416975183,
+        "precision": 0.8421095669207056,
+        "recall": 0.8465074626865672,
+        "support": 33500.0
+      },
+      "step": 287
+    },
+    {
+      "epoch": 8.0,
+      "eval_B-Claim": {
+        "f1-score": 0.623229461756374,
+        "precision": 0.5994550408719346,
+        "recall": 0.6489675516224189,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7987987987987989,
+        "precision": 0.7687861271676301,
+        "recall": 0.83125,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7859614434008898,
+        "precision": 0.7347504621072088,
+        "recall": 0.844845908607864,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.620274914089347,
+        "precision": 0.6259211096662332,
+        "recall": 0.6147296722009365,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8596871239470517,
+        "precision": 0.8396803008932769,
+        "recall": 0.8806706114398422,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8772429318678407,
+        "precision": 0.8634082763115021,
+        "recall": 0.8915281609582127,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9116210214655811,
+        "precision": 0.9433210784313726,
+        "recall": 0.8819822400458321,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8450149253731343,
+      "eval_loss": 0.5492746829986572,
+      "eval_macro avg": {
+        "f1-score": 0.782402242189412,
+        "precision": 0.7679031993498798,
+        "recall": 0.7991391635535867,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4551,
+      "eval_samples_per_second": 55.667,
+      "eval_steps_per_second": 7.56,
+      "eval_weighted avg": {
+        "f1-score": 0.8453815974816967,
+        "precision": 0.8469129043625616,
+        "recall": 0.8450149253731343,
+        "support": 33500.0
+      },
+      "step": 328
+    },
+    {
+      "epoch": 9.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5891472868217054,
+        "precision": 0.6209150326797386,
+        "recall": 0.56047197640118,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.8050314465408804,
+        "precision": 0.810126582278481,
+        "recall": 0.8,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7891566265060241,
+        "precision": 0.7478591817316841,
+        "recall": 0.8352816153028693,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5999312793494446,
+        "precision": 0.6493925117778329,
+        "recall": 0.5574712643678161,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8532857870606215,
+        "precision": 0.8825079030558483,
+        "recall": 0.8259368836291914,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8768981374268038,
+        "precision": 0.8624886112195757,
+        "recall": 0.8917973218491353,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9065734133547564,
+        "precision": 0.8974550898203593,
+        "recall": 0.9158789267640599,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8430746268656717,
+      "eval_loss": 0.5794806480407715,
+      "eval_macro avg": {
+        "f1-score": 0.7742891395800339,
+        "precision": 0.7815349875090741,
+        "recall": 0.7695482840448931,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4526,
+      "eval_samples_per_second": 55.763,
+      "eval_steps_per_second": 7.573,
+      "eval_weighted avg": {
+        "f1-score": 0.840184765735164,
+        "precision": 0.8388330863882018,
+        "recall": 0.8430746268656717,
+        "support": 33500.0
+      },
+      "step": 369
+    },
+    {
+      "epoch": 10.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5950155763239875,
+        "precision": 0.6303630363036303,
+        "recall": 0.5634218289085545,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.8123076923076924,
+        "precision": 0.8,
+        "recall": 0.825,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7884143348060874,
+        "precision": 0.7326642335766423,
+        "recall": 0.8533475026567482,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6070517281373231,
+        "precision": 0.666921508664628,
+        "recall": 0.5570455512984248,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8758397611346106,
+        "precision": 0.8839779005524862,
+        "recall": 0.8678500986193294,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8810970656094628,
+        "precision": 0.851998491704374,
+        "recall": 0.9122535495592491,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9168205227869012,
+        "precision": 0.9333267385498071,
+        "recall": 0.900887997708393,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8505970149253731,
+      "eval_loss": 0.5959911346435547,
+      "eval_macro avg": {
+        "f1-score": 0.7823638115865806,
+        "precision": 0.7856074156216526,
+        "recall": 0.7828295041072427,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4562,
+      "eval_samples_per_second": 55.623,
+      "eval_steps_per_second": 7.554,
+      "eval_weighted avg": {
+        "f1-score": 0.8476881875144826,
+        "precision": 0.8475616436173209,
+        "recall": 0.8505970149253731,
+        "support": 33500.0
+      },
+      "step": 410
+    },
+    {
+      "epoch": 11.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6244477172312225,
+        "precision": 0.6235294117647059,
+        "recall": 0.6253687315634219,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.8168168168168167,
+        "precision": 0.7861271676300579,
+        "recall": 0.85,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7952917093142272,
+        "precision": 0.7670286278381047,
+        "recall": 0.8257173219978746,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.639956686518679,
+        "precision": 0.6513114392770554,
+        "recall": 0.6289910600255428,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8596819457436857,
+        "precision": 0.8176156583629893,
+        "recall": 0.9063116370808678,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8823608047590401,
+        "precision": 0.8765022242878959,
+        "recall": 0.8882982302671422,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9133537206931702,
+        "precision": 0.9289099526066351,
+        "recall": 0.8983099398453165,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8515522388059702,
+      "eval_loss": 0.5953634977340698,
+      "eval_macro avg": {
+        "f1-score": 0.7902727715824059,
+        "precision": 0.7787177831096349,
+        "recall": 0.8032852743971665,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4583,
+      "eval_samples_per_second": 55.544,
+      "eval_steps_per_second": 7.543,
+      "eval_weighted avg": {
+        "f1-score": 0.8513139373395039,
+        "precision": 0.8516743266232883,
+        "recall": 0.8515522388059702,
+        "support": 33500.0
+      },
+      "step": 451
+    },
+    {
+      "epoch": 12.0,
+      "eval_B-Claim": {
+        "f1-score": 0.6188466947960619,
+        "precision": 0.5913978494623656,
+        "recall": 0.6489675516224189,
+        "support": 339.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.8119402985074626,
+        "precision": 0.7771428571428571,
+        "recall": 0.85,
+        "support": 160.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7870702924576707,
+        "precision": 0.7609126984126984,
+        "recall": 0.8150903294367694,
+        "support": 941.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.6262368337057134,
+        "precision": 0.6260370134014039,
+        "recall": 0.6264367816091954,
+        "support": 4698.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.8551000953288845,
+        "precision": 0.827490774907749,
+        "recall": 0.8846153846153846,
+        "support": 2028.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8772554685662445,
+        "precision": 0.8761073825503356,
+        "recall": 0.8784065675257385,
+        "support": 14861.0
+      },
+      "eval_O": {
+        "f1-score": 0.9119085670008232,
+        "precision": 0.9252161949685535,
+        "recall": 0.8989783252172252,
+        "support": 10473.0
+      },
+      "eval_accuracy": 0.8456417910447761,
+      "eval_loss": 0.6605897545814514,
+      "eval_macro avg": {
+        "f1-score": 0.784051178623266,
+        "precision": 0.7691863958351375,
+        "recall": 0.8003564200038189,
+        "support": 33500.0
+      },
+      "eval_runtime": 1.4573,
+      "eval_samples_per_second": 55.582,
+      "eval_steps_per_second": 7.548,
+      "eval_weighted avg": {
+        "f1-score": 0.8460850209295142,
+        "precision": 0.8468579038739062,
+        "recall": 0.8456417910447761,
+        "support": 33500.0
+      },
+      "step": 492
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 656,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 16,
+  "save_steps": 500,
+  "total_flos": 1720131088788000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-492/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:920ab155975bf66f694757fefb246b73b0d1489bdf4f03eda383fa028f5d083a
+size 4664

checkpoint-492/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff