Makrrr
/

Qwen3-1.7B-GSM8K-GRPO-verl

Reinforcement Learning

Model card Files Files and versions Community

Qwen3-1.7B-GSM8K-GRPO-verl

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

Makrrr's picture

Update README.md

ce2bc1d verified 23 days ago