Metin
/

LLaMA-3-8B-Math-Majority-Vote-GRPO

Text Generation

text-generation-inference

test-time-reinforcement-learning

Model card Files Files and versions Community

LLaMA-3-8B-Math-Majority-Vote-GRPO / model.safetensors.index.json

Commit History

Trained with Unsloth

5bcefe6
verified

Metin commited on May 14