Metin
/

LLaMA-3-8B-Math-Majority-Vote-GRPO

Text Generation

text-generation-inference

test-time-reinforcement-learning

Model card Files Files and versions Community

LLaMA-3-8B-Math-Majority-Vote-GRPO

Ctrl+K

Ctrl+K

1 contributor

History: 10 commits

Metin's picture

Update README.md

285253d verified about 1 month ago