gbennani
/

MNLP_M2_RAG_model

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

gbennani commited on 14 days ago

Commit

c7773b3

·

verified ·

1 Parent(s): ad0de5b

End of training

Files changed (2) hide show

README.md +4 -5
generation_config.json +1 -1

README.md CHANGED Viewed

@@ -35,13 +35,12 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
 - train_batch_size: 1
-- eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 8
-- total_train_batch_size: 8
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 3
 ### Training results
@@ -49,7 +48,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.52.3
 - Pytorch 2.5.1+cu124
-- Datasets 3.6.0
 - Tokenizers 0.21.0

 The following hyperparameters were used during training:
 - learning_rate: 5e-05
 - train_batch_size: 1
+- eval_batch_size: 1
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 3
+- mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- Transformers 4.52.4
 - Pytorch 2.5.1+cu124
+- Datasets 2.21.0
 - Tokenizers 0.21.0

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "bos_token_id": 151643,
   "eos_token_id": 151643,
   "max_new_tokens": 2048,
-  "transformers_version": "4.52.3"
 }

   "bos_token_id": 151643,
   "eos_token_id": 151643,
   "max_new_tokens": 2048,
+  "transformers_version": "4.52.4"
 }