GTMX
/

Qwen2-0.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO / runs /Sep25_02-00-38_12306e885d7f

6.6 kB

1 contributor

History: 1 commit

GTMX's picture

End of GRPO training 🚀

9b8f101 verified about 1 month ago

events.out.tfevents.1758765655.12306e885d7f.1604.0

6.6 kB
xet

End of GRPO training 🚀 about 1 month ago