krinetic1234
/

Llama-3B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3B-Open-R1-GRPO

Commit History

End of training

f0699fe
verified

krinetic1234 commited on Mar 13

Model save

b1b124f
verified

krinetic1234 commited on Mar 13

initial commit

76e1ab1
verified

krinetic1234 commited on Mar 13