Metin
/

LLaMA-3-8B-Math-Majority-Vote-GRPO

Text Generation

text-generation-inference

test-time-reinforcement-learning

Model card Files Files and versions Community

LLaMA-3-8B-Math-Majority-Vote-GRPO

Commit History

Update README.md

285253d
verified

Metin commited on May 18

Update README.md

9885575
verified

Metin commited on May 18

Update README.md

fcb5e07
verified

Metin commited on May 18

Update README.md

5f99087
verified

Metin commited on May 18

Upload llama_clones.png

0a728d9
verified

Metin commited on May 18

Update README.md

bb87305
verified

Metin commited on May 18

Trained with Unsloth

5bcefe6
verified

Metin commited on May 14

Upload tokenizer

52635a2
verified

Metin commited on May 14

Upload README.md with huggingface_hub

7eef5be
verified

Metin commited on May 14

initial commit

5b1ba9e
verified

Metin commited on May 14