zztheaven
/

Llama-3.2-1B-Instruct-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.2-1B-Instruct-Open-R1-GRPO

Commit History

End of training

ad4603e
verified

zztheaven commited on Feb 21

Model save

3c4b564
verified

zztheaven commited on Feb 21

Training in progress, epoch 1

4934f7c
verified

zztheaven commited on Feb 21

initial commit

fdc20eb
verified

zztheaven commited on Feb 21