Lansechen
/

Qwen2.5-7B-Open-R1-GRPO-math3to5-cosine-0507-wRv2

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-Open-R1-GRPO-math3to5-cosine-0507-wRv2

Commit History

End of training

67fee56
verified

Lansechen commited on May 8

Model save

88b38f8
verified

Lansechen commited on May 8

Training in progress, epoch 1

e8a11b2
verified

Lansechen commited on May 8

Training in progress, epoch 0

116466b
verified

Lansechen commited on May 7

initial commit

e836f4a
verified

Lansechen commited on May 7