TimaeusWorld
/

Qwen2.5-0.5B-GRPO-test

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-0.5B-GRPO-test / runs

35.9 kB

1 contributor

History: 19 commits

TimaeusWorld's picture

Training in progress, step 70

5be5c14 verified 7 months ago