bertin-project
/

bertin-roberta-base-spanish

Model card Files Files and versions

Metrics Training metrics Community

versae commited on Jul 4, 2021

Commit

a95f7b8

·

1 Parent(s): 40f69ff

Changed batch size

Files changed (2) hide show

run.sh +9 -3
run_mlm_flax.py +4 -4

run.sh CHANGED Viewed

@@ -6,10 +6,16 @@
     --dataset_name="large_spanish_corpus" \
     --dataset_config_name="combined" \
     --max_seq_length="128" \
-    --per_device_train_batch_size="4" \
-    --per_device_eval_batch_size="4" \
     --learning_rate="3e-4" \
     --warmup_steps="1000" \
     --overwrite_output_dir \
     --num_train_epochs="8" \
-    --push_to_hub

     --dataset_name="large_spanish_corpus" \
     --dataset_config_name="combined" \
     --max_seq_length="128" \
+    --pad_to_max_length  \
+    --per_device_train_batch_size="128" \
+    --per_device_eval_batch_size="128" \
     --learning_rate="3e-4" \
+    --save_strategy="steps" \
+    --save_steps="10000" \
+    --save_total_limit="5" \
     --warmup_steps="1000" \
     --overwrite_output_dir \
     --num_train_epochs="8" \
+    --dtype="bfloat16" \
+    --push_to_hub_model_id="flax-community/bertin-roberta-large-spanish" \
+    --push_to_hub 2>&1 | tee run.log

run_mlm_flax.py CHANGED Viewed

@@ -315,10 +315,10 @@ if __name__ == "__main__":
     # Log on each process the small summary:
     logger = logging.getLogger(__name__)
-    logger.warning(
-        f"Process rank: {training_args.local_rank}, device: {training_args.device}, n_gpu: {training_args.n_gpu}"
-        + f"distributed training: {bool(training_args.local_rank != -1)}, 16-bits training: {training_args.fp16}"
-    )
     # Set the verbosity to info of the Transformers logger (on main process only):
     logger.info(f"Training/evaluation parameters {training_args}")

     # Log on each process the small summary:
     logger = logging.getLogger(__name__)
+    #logger.warning(
+    #    f"Process rank: {training_args.local_rank}, device: {training_args.device}, n_gpu: {training_args.n_gpu}"
+    #    + f"distributed training: {bool(training_args.local_rank != -1)}, 16-bits training: {training_args.fp16}"
+    #)
     # Set the verbosity to info of the Transformers logger (on main process only):
     logger.info(f"Training/evaluation parameters {training_args}")