salman-abdullah
/

Llama-1B-GRPO-test

Model card Files Files and versions Metrics Training metrics Community

Llama-1B-GRPO-test / model.safetensors

Commit History

Training in progress, step 10

4cce878
verified

salman-abdullah commited on May 8