Thabet
/

SmolGRPO-135M-learning

Text Generation

Reasoning-Course

text-generation-inference

Model card Files Files and versions Community

SmolGRPO-135M-learning

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

Thabet's picture

Upload LlamaForCausalLM

c973ce9 verified 4 days ago