adobe-codemay2025 commited on May 21

Commit

bd2093b

verified ·

1 Parent(s): 6ffd255

adobe-codemay2025/injection-detector

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +12 -11
config.json +27 -39
model.safetensors +2 -2
special_tokens_map.json +5 -35
tokenizer.json +0 -0
tokenizer_config.json +13 -900
training_args.bin +1 -1
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/config.json +35 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/model.safetensors +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/optimizer.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/rng_state.pth +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/scheduler.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/special_tokens_map.json +7 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/tokenizer.json +0 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/tokenizer_config.json +58 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/trainer_state.json +50 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/training_args.bin +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/vocab.txt +0 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/config.json +35 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/model.safetensors +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/optimizer.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/rng_state.pth +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/scheduler.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/special_tokens_map.json +7 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/tokenizer.json +0 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/tokenizer_config.json +58 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/trainer_state.json +62 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/training_args.bin +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/vocab.txt +0 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/config.json +35 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/model.safetensors +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/optimizer.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/rng_state.pth +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/scheduler.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/special_tokens_map.json +7 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/tokenizer.json +0 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/tokenizer_config.json +58 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/trainer_state.json +74 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/training_args.bin +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/vocab.txt +0 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/config.json +35 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/model.safetensors +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/optimizer.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/rng_state.pth +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/scheduler.pt +3 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/special_tokens_map.json +7 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/tokenizer.json +0 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/tokenizer_config.json +58 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/trainer_state.json +62 -0
trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/training_args.bin +3 -0

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 library_name: transformers
 license: apache-2.0
-base_model: answerdotai/ModernBERT-base
 tags:
 - generated_from_trainer
 metrics:
@@ -19,13 +19,13 @@ should probably proofread and complete it, then remove this comment. -->
 # results
-This model is a fine-tuned version of [answerdotai/ModernBERT-base](https://huggingface.co/answerdotai/ModernBERT-base) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6145
-- Accuracy: 0.625
-- Precision: 0.6389
-- Recall: 0.625
-- F1: 0.5615
 ## Model description
@@ -44,20 +44,21 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 3.1008099293113248e-06
 - train_batch_size: 32
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 2
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
-| No log        | 1.0   | 7    | 0.6498          | 0.5417   | 0.5044    | 0.5417 | 0.5000 |
-| No log        | 2.0   | 14   | 0.6145          | 0.625    | 0.6389    | 0.625  | 0.5615 |
 ### Framework versions

 ---
 library_name: transformers
 license: apache-2.0
+base_model: distilbert/distilbert-base-uncased-finetuned-sst-2-english
 tags:
 - generated_from_trainer
 metrics:
 # results
+This model is a fine-tuned version of [distilbert/distilbert-base-uncased-finetuned-sst-2-english](https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1401
+- Accuracy: 0.9583
+- Precision: 0.9621
+- Recall: 0.9583
+- F1: 0.9586
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 9.755035812704661e-05
 - train_batch_size: 32
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 3
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
+| No log        | 1.0   | 7    | 0.2914          | 0.875    | 0.9038    | 0.875  | 0.8757 |
+| No log        | 2.0   | 14   | 0.2127          | 0.9583   | 0.9621    | 0.9583 | 0.9586 |
+| No log        | 3.0   | 21   | 0.1401          | 0.9583   | 0.9621    | 0.9583 | 0.9586 |
 ### Framework versions

config.json CHANGED Viewed

@@ -1,47 +1,35 @@
 {
-  "_name_or_path": "answerdotai/ModernBERT-base",
   "architectures": [
-    "ModernBertForSequenceClassification"
   ],
-  "attention_bias": false,
-  "attention_dropout": 0.0,
-  "bos_token_id": 50281,
-  "classifier_activation": "gelu",
-  "classifier_bias": false,
-  "classifier_dropout": 0.0,
-  "classifier_pooling": "mean",
-  "cls_token_id": 50281,
-  "decoder_bias": true,
-  "deterministic_flash_attn": false,
-  "embedding_dropout": 0.0,
-  "eos_token_id": 50282,
-  "global_attn_every_n_layers": 3,
-  "global_rope_theta": 160000.0,
-  "gradient_checkpointing": false,
-  "hidden_activation": "gelu",
-  "hidden_size": 768,
-  "initializer_cutoff_factor": 2.0,
   "initializer_range": 0.02,
-  "intermediate_size": 1152,
-  "layer_norm_eps": 1e-05,
-  "local_attention": 128,
-  "local_rope_theta": 10000.0,
-  "max_position_embeddings": 8192,
-  "mlp_bias": false,
-  "mlp_dropout": 0.0,
-  "model_type": "modernbert",
-  "norm_bias": false,
-  "norm_eps": 1e-05,
-  "num_attention_heads": 12,
-  "num_hidden_layers": 22,
-  "pad_token_id": 50283,
-  "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
-  "reference_compile": true,
-  "sep_token_id": 50282,
-  "sparse_pred_ignore_index": -100,
-  "sparse_prediction": false,
   "torch_dtype": "float32",
   "transformers_version": "4.48.0.dev0",
-  "vocab_size": 50368
 }

 {
+  "_name_or_path": "distilbert/distilbert-base-uncased-finetuned-sst-2-english",
+  "activation": "gelu",
   "architectures": [
+    "DistilBertForSequenceClassification"
   ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "finetuning_task": "sst-2",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "NEGATIVE",
+    "1": "POSITIVE"
+  },
   "initializer_range": 0.02,
+  "label2id": {
+    "NEGATIVE": 0,
+    "POSITIVE": 1
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
   "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
   "torch_dtype": "float32",
   "transformers_version": "4.48.0.dev0",
+  "vocab_size": 30522
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:36fea5347aaf8d126227bcbbe158c1ea586bbaaa39f805037d42c61debe3a8ed
-size 598439784

 version https://git-lfs.github.com/spec/v1
+oid sha256:d45d3c6340d2d2aeb88f11a27ee3db0df9baae52ab03fd12581c020d1f0fc7ed
+size 267832560

special_tokens_map.json CHANGED Viewed

@@ -1,37 +1,7 @@
 {
-  "cls_token": {
-    "content": "[CLS]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "mask_token": {
-    "content": "[MASK]",
-    "lstrip": true,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": {
-    "content": "[PAD]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "sep_token": {
-    "content": "[SEP]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "unk_token": {
-    "content": "[UNK]",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  }
 }

 {
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
 }

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1,230 +1,14 @@
 {
   "added_tokens_decoder": {
     "0": {
-      "content": "|||IP_ADDRESS|||",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "1": {
-      "content": "<|padding|>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50254": {
-      "content": "                        ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50255": {
-      "content": "                       ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50256": {
-      "content": "                      ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50257": {
-      "content": "                     ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50258": {
-      "content": "                    ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50259": {
-      "content": "                   ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50260": {
-      "content": "                  ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50261": {
-      "content": "                 ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50262": {
-      "content": "                ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50263": {
-      "content": "               ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50264": {
-      "content": "              ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50265": {
-      "content": "             ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50266": {
-      "content": "            ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50267": {
-      "content": "           ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50268": {
-      "content": "          ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50269": {
-      "content": "         ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50270": {
-      "content": "        ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50271": {
-      "content": "       ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50272": {
-      "content": "      ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50273": {
-      "content": "     ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50274": {
-      "content": "    ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50275": {
-      "content": "   ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50276": {
-      "content": "  ",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50277": {
-      "content": "|||EMAIL_ADDRESS|||",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50278": {
-      "content": "|||PHONE_NUMBER|||",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50279": {
-      "content": "<|endoftext|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "50280": {
       "content": "[UNK]",
       "lstrip": false,
       "normalized": false,
@@ -232,7 +16,7 @@
       "single_word": false,
       "special": true
     },
-    "50281": {
       "content": "[CLS]",
       "lstrip": false,
       "normalized": false,
@@ -240,7 +24,7 @@
       "single_word": false,
       "special": true
     },
-    "50282": {
       "content": "[SEP]",
       "lstrip": false,
       "normalized": false,
@@ -248,698 +32,27 @@
       "single_word": false,
       "special": true
     },
-    "50283": {
-      "content": "[PAD]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50284": {
       "content": "[MASK]",
-      "lstrip": true,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
-    },
-    "50285": {
-      "content": "[unused0]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50286": {
-      "content": "[unused1]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50287": {
-      "content": "[unused2]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50288": {
-      "content": "[unused3]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50289": {
-      "content": "[unused4]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50290": {
-      "content": "[unused5]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50291": {
-      "content": "[unused6]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50292": {
-      "content": "[unused7]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50293": {
-      "content": "[unused8]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50294": {
-      "content": "[unused9]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50295": {
-      "content": "[unused10]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50296": {
-      "content": "[unused11]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50297": {
-      "content": "[unused12]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50298": {
-      "content": "[unused13]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50299": {
-      "content": "[unused14]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50300": {
-      "content": "[unused15]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50301": {
-      "content": "[unused16]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50302": {
-      "content": "[unused17]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50303": {
-      "content": "[unused18]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50304": {
-      "content": "[unused19]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50305": {
-      "content": "[unused20]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50306": {
-      "content": "[unused21]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50307": {
-      "content": "[unused22]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50308": {
-      "content": "[unused23]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50309": {
-      "content": "[unused24]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50310": {
-      "content": "[unused25]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50311": {
-      "content": "[unused26]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50312": {
-      "content": "[unused27]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50313": {
-      "content": "[unused28]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50314": {
-      "content": "[unused29]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50315": {
-      "content": "[unused30]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50316": {
-      "content": "[unused31]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50317": {
-      "content": "[unused32]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50318": {
-      "content": "[unused33]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50319": {
-      "content": "[unused34]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50320": {
-      "content": "[unused35]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50321": {
-      "content": "[unused36]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50322": {
-      "content": "[unused37]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50323": {
-      "content": "[unused38]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50324": {
-      "content": "[unused39]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50325": {
-      "content": "[unused40]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50326": {
-      "content": "[unused41]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50327": {
-      "content": "[unused42]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50328": {
-      "content": "[unused43]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50329": {
-      "content": "[unused44]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50330": {
-      "content": "[unused45]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50331": {
-      "content": "[unused46]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50332": {
-      "content": "[unused47]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50333": {
-      "content": "[unused48]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50334": {
-      "content": "[unused49]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50335": {
-      "content": "[unused50]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50336": {
-      "content": "[unused51]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50337": {
-      "content": "[unused52]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50338": {
-      "content": "[unused53]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50339": {
-      "content": "[unused54]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50340": {
-      "content": "[unused55]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50341": {
-      "content": "[unused56]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50342": {
-      "content": "[unused57]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50343": {
-      "content": "[unused58]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50344": {
-      "content": "[unused59]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50345": {
-      "content": "[unused60]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50346": {
-      "content": "[unused61]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50347": {
-      "content": "[unused62]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50348": {
-      "content": "[unused63]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50349": {
-      "content": "[unused64]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50350": {
-      "content": "[unused65]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50351": {
-      "content": "[unused66]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50352": {
-      "content": "[unused67]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50353": {
-      "content": "[unused68]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50354": {
-      "content": "[unused69]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50355": {
-      "content": "[unused70]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50356": {
-      "content": "[unused71]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50357": {
-      "content": "[unused72]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50358": {
-      "content": "[unused73]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50359": {
-      "content": "[unused74]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50360": {
-      "content": "[unused75]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50361": {
-      "content": "[unused76]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50362": {
-      "content": "[unused77]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50363": {
-      "content": "[unused78]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50364": {
-      "content": "[unused79]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50365": {
-      "content": "[unused80]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50366": {
-      "content": "[unused81]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50367": {
-      "content": "[unused82]",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
     }
   },
   "clean_up_tokenization_spaces": true,
   "cls_token": "[CLS]",
   "extra_special_tokens": {},
   "mask_token": "[MASK]",
-  "model_input_names": [
-    "input_ids",
-    "attention_mask"
-  ],
-  "model_max_length": 8192,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
-  "tokenizer_class": "PreTrainedTokenizerFast",
   "unk_token": "[UNK]"
 }

 {
   "added_tokens_decoder": {
     "0": {
+      "content": "[PAD]",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "100": {
       "content": "[UNK]",
       "lstrip": false,
       "normalized": false,
       "single_word": false,
       "special": true
     },
+    "101": {
       "content": "[CLS]",
       "lstrip": false,
       "normalized": false,
       "single_word": false,
       "special": true
     },
+    "102": {
       "content": "[SEP]",
       "lstrip": false,
       "normalized": false,
       "single_word": false,
       "special": true
     },
+    "103": {
       "content": "[MASK]",
+      "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     }
   },
   "clean_up_tokenization_spaces": true,
   "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
   "extra_special_tokens": {},
   "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
   "unk_token": "[UNK]"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8893bc65b7c023594e1f5e168212876ac4146bba0d157ebc60a10b6711957757
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:e8a6b0729a29c2098575f3533b396747556def8d2ffc03b2630747b8ab51429e
 size 5368

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "distilbert/distilbert-base-uncased-finetuned-sst-2-english",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "finetuning_task": "sst-2",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "NEGATIVE",
+    "1": "POSITIVE"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "NEGATIVE": 0,
+    "POSITIVE": 1
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.0.dev0",
+  "vocab_size": 30522
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a563fb7e73103a7b604d083e043eb785045fd605e856f317de8fac665dd6a86f
+size 267832560

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eff2c710630c9a43acd1cb095c8fdaf73b9c38c277a4df4f5522defca80a0b96
+size 535727290

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:80ef0c229eb7e41a472af9577be0ab8f9a527c90c97f4cb8ba6946afe6a769ba
+size 14308

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6082019d8c92290a8b1a20e35867d31ba202a10378b8f414f67d035bf114c590
+size 1064

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/trainer_state.json ADDED Viewed

	@@ -0,0 +1,50 @@

+{
+  "best_metric": 0.705686630369026,
+  "best_model_checkpoint": "./results/trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 14,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7083333333333334,
+      "eval_f1": 0.705686630369026,
+      "eval_loss": 1.1053823232650757,
+      "eval_precision": 0.7055555555555554,
+      "eval_recall": 0.7083333333333334,
+      "eval_runtime": 0.0552,
+      "eval_samples_per_second": 434.724,
+      "eval_steps_per_second": 36.227,
+      "step": 14
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 42,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0,
+  "train_batch_size": 16,
+  "trial_name": "trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>",
+  "trial_params": {
+    "learning_rate": 1.6736924699428189e-06,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 16,
+    "seed": 29
+  }
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:002043f78001120c873ae3422dfacd766cf7dd3ecc538f26b6be14cf76b90ecb
+size 5304

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-14/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "distilbert/distilbert-base-uncased-finetuned-sst-2-english",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "finetuning_task": "sst-2",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "NEGATIVE",
+    "1": "POSITIVE"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "NEGATIVE": 0,
+    "POSITIVE": 1
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.0.dev0",
+  "vocab_size": 30522
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:23e8f6097bd785dc4a80efde0071814d2a8a24d197b0446264aa57b13e973986
+size 267832560

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:455593754683f63e2066f814da10587b0320f32aa6429277fcaf1910b88ec125
+size 535727290

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9778e33f0e2c5d7c90bc2020333ba9a60259dce674098743e0923ebc46cd3527
+size 14308

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:45bdc9092a0b7caca774a6f53e11ba41f5ba6bcc6fb603e0312cbe92daeca125
+size 1064

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/trainer_state.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "best_metric": 0.75,
+  "best_model_checkpoint": "./results/trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 28,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7083333333333334,
+      "eval_f1": 0.705686630369026,
+      "eval_loss": 1.1053823232650757,
+      "eval_precision": 0.7055555555555554,
+      "eval_recall": 0.7083333333333334,
+      "eval_runtime": 0.0552,
+      "eval_samples_per_second": 434.724,
+      "eval_steps_per_second": 36.227,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.75,
+      "eval_f1": 0.75,
+      "eval_loss": 0.9916526675224304,
+      "eval_precision": 0.75,
+      "eval_recall": 0.75,
+      "eval_runtime": 0.0571,
+      "eval_samples_per_second": 420.605,
+      "eval_steps_per_second": 35.05,
+      "step": 28
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 42,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0,
+  "train_batch_size": 16,
+  "trial_name": "trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>",
+  "trial_params": {
+    "learning_rate": 1.6736924699428189e-06,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 16,
+    "seed": 29
+  }
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:002043f78001120c873ae3422dfacd766cf7dd3ecc538f26b6be14cf76b90ecb
+size 5304

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-28/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "distilbert/distilbert-base-uncased-finetuned-sst-2-english",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "finetuning_task": "sst-2",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "NEGATIVE",
+    "1": "POSITIVE"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "NEGATIVE": 0,
+    "POSITIVE": 1
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.0.dev0",
+  "vocab_size": 30522
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:581e7934f2e3c380c9f98e7052b140030db513c25463ed1297b28c5f37c0a15f
+size 267832560

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6cae7abc84af99dfd05cda7735ddd269b879b061c664d5d9cf7680197a7505f1
+size 535727290

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b165aacf5bb384cb3eac3a98838abb3b01e9ed93c2d1f0f1ffc804d8ad536af2
+size 14308

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d5cd22dd91f3b3918b1b30ba6ec3fa2fa8023dddc9ce47c221fda726c77dbba4
+size 1064

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/trainer_state.json ADDED Viewed

	@@ -0,0 +1,74 @@

+{
+  "best_metric": 0.7897761645493043,
+  "best_model_checkpoint": "./results/trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 42,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7083333333333334,
+      "eval_f1": 0.705686630369026,
+      "eval_loss": 1.1053823232650757,
+      "eval_precision": 0.7055555555555554,
+      "eval_recall": 0.7083333333333334,
+      "eval_runtime": 0.0552,
+      "eval_samples_per_second": 434.724,
+      "eval_steps_per_second": 36.227,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.75,
+      "eval_f1": 0.75,
+      "eval_loss": 0.9916526675224304,
+      "eval_precision": 0.75,
+      "eval_recall": 0.75,
+      "eval_runtime": 0.0571,
+      "eval_samples_per_second": 420.605,
+      "eval_steps_per_second": 35.05,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7916666666666666,
+      "eval_f1": 0.7897761645493043,
+      "eval_loss": 0.9532522559165955,
+      "eval_precision": 0.7907407407407407,
+      "eval_recall": 0.7916666666666666,
+      "eval_runtime": 0.0717,
+      "eval_samples_per_second": 334.856,
+      "eval_steps_per_second": 27.905,
+      "step": 42
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 42,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0,
+  "train_batch_size": 16,
+  "trial_name": "trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>",
+  "trial_params": {
+    "learning_rate": 1.6736924699428189e-06,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 16,
+    "seed": 29
+  }
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:002043f78001120c873ae3422dfacd766cf7dd3ecc538f26b6be14cf76b90ecb
+size 5304

trial_<optuna.trial._trial.Trial object at 0x7d9ff2550150>/checkpoint-42/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "distilbert/distilbert-base-uncased-finetuned-sst-2-english",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "finetuning_task": "sst-2",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "NEGATIVE",
+    "1": "POSITIVE"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "NEGATIVE": 0,
+    "POSITIVE": 1
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.0.dev0",
+  "vocab_size": 30522
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:697fed9d1e7489d81117749aae0dc51f0780a65282e9ffbe28552f0c9ca840f2
+size 267832560

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1aef5a4357e0b16fe5bf3cdf9c0a0c261343b6b815348db058da89d4cf729dd1
+size 535727290

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d5f3ae4cbee033473d464e45f9bd12dce3f9e537ccc9d9eac3ad2d28f7d3f81b
+size 14308

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b499a6062aa4c5ff07cdad92bf04236dd5068c81c294bb0b38da2a045a00443f
+size 1064

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/trainer_state.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "best_metric": 0.9172494172494172,
+  "best_model_checkpoint": "./results/trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-7",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 14,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9166666666666666,
+      "eval_f1": 0.9172494172494172,
+      "eval_loss": 0.354879230260849,
+      "eval_precision": 0.9305555555555557,
+      "eval_recall": 0.9166666666666666,
+      "eval_runtime": 0.0704,
+      "eval_samples_per_second": 340.712,
+      "eval_steps_per_second": 28.393,
+      "step": 7
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9166666666666666,
+      "eval_f1": 0.9172494172494172,
+      "eval_loss": 0.23112539947032928,
+      "eval_precision": 0.9305555555555557,
+      "eval_recall": 0.9166666666666666,
+      "eval_runtime": 0.0594,
+      "eval_samples_per_second": 403.879,
+      "eval_steps_per_second": 33.657,
+      "step": 14
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 21,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0,
+  "train_batch_size": 32,
+  "trial_name": "trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>",
+  "trial_params": {
+    "learning_rate": 9.755035812704661e-05,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 32,
+    "seed": 8
+  }
+}

trial_<optuna.trial._trial.Trial object at 0x7d9ff26e0850>/checkpoint-14/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fd53fe6c7e1a01e4ffb6cdd3f0842509c111b0ada3d4f491be073c0d4c862f5
+size 5304