Lansechen
/

Qwen2.5-3B-Open-R1-GRPO-math-selected-default

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Open-R1-GRPO-math-selected-default / all_results.json

Commit History

Model save

dfe2499
verified

Lansechen commited on Apr 12