andreaskoepf
/

pythia-2.8b-gpt4all-pretrain

Text Generation

text-generation-inference

Model card Files Files and versions

andreaskoepf commited on Apr 9, 2023

Commit

598588b

·

1 Parent(s): 8660a61

Update README.md

Files changed (1) hide show

README.md +5 -1

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ license: apache-2.0
 ---
 wandb: https://wandb.ai/open-assistant/supervised-finetuning/runs/pgftwpjx
 datasets:
 ```
 pretrain:
@@ -56,4 +58,6 @@ pythia-2.8b-pretrain:
   per_device_eval_batch_size: 12
   num_train_epochs: 2
   save_total_limit: 2
-```

 ---
 wandb: https://wandb.ai/open-assistant/supervised-finetuning/runs/pgftwpjx
+checkpoint: 11k steps
 datasets:
 ```
 pretrain:
   per_device_eval_batch_size: 12
   num_train_epochs: 2
   save_total_limit: 2
+```
+command: `deepspeed trainer_sft.py --configs defaults pretrain pythia-2.8b-pretrain --cache_dir .cache/ --output_dir .saved_models/pythia-2.8b-pre --residual_dropout 0.0 --deepspeed`