GTMX
/

Qwen2-0.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO / runs

57.2 kB

1 contributor

History: 1 commit

GTMX's picture

End of GRPO training 🚀

9b8f101 verified 23 days ago