nghind
/

grpo-llama-3-1-8b-math-ep3

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

grpo-llama-3-1-8b-math-ep3 / runs

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

nghind's picture

Model save

355d9d3 verified 4 months ago