Lansechen
/

Qwen2.5-3B-Open-R1-GRPO-math-selected-cosine-noRW

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Open-R1-GRPO-math-selected-cosine-noRW

Commit History

End of training

f03baf8
verified

Lansechen commited on 4 days ago

Model save

d99ddee
verified

Lansechen commited on 4 days ago

Training in progress, epoch 1

7494e4f
verified

Lansechen commited on 4 days ago

Training in progress, epoch 0

1ced99c
verified

Lansechen commited on 4 days ago

initial commit

0c5e4c2
verified

Lansechen commited on 5 days ago