sunblaze-ucb
/

Qwen3-14B-GRPO-MATH-1EPOCH

Text Generation

reinforcement-learning

text-generation-inference

Model card Files Files and versions

Qwen3-14B-GRPO-MATH-1EPOCH / generation_config.json

Commit History

Upload folder using huggingface_hub

5a9d72f
verified

Xuandong commited on Jun 16