abaryan
/

GRPO_GSM8K_Qwen2.5-1.5B_NoQuantisation

Reinforcement Learning

text-generation

text-generation-inference

Model card Files Files and versions Community

GRPO_GSM8K_Qwen2.5-1.5B_NoQuantisation

Ctrl+K

Ctrl+K

1 contributor

History: 5 commits

Abaryan

Update README.md

1e3b7b1 verified 3 months ago