Lansechen
/

Qwen2.5-3B-Open-R1-GRPO-math-selected-cosine-v2

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Open-R1-GRPO-math-selected-cosine-v2

Commit History

End of training

d594db1
verified

Lansechen commited on about 1 month ago

Model save

9876eaa
verified

Lansechen commited on about 1 month ago

Training in progress, epoch 1

8571024
verified

Lansechen commited on about 1 month ago

Training in progress, epoch 0

96561f8
verified

Lansechen commited on about 1 month ago

initial commit

4c15f9b
verified

Lansechen commited on Apr 11