Lansechen
/

Qwen2.5-7B-Open-R1-GRPO-math3to5-cosine-0507-wR

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-7B-Open-R1-GRPO-math3to5-cosine-0507-wR / added_tokens.json

Commit History

Training in progress, epoch 0

f7974f0
verified

Lansechen commited on 5 days ago