longlian
/

Qwen2-0.5B-GRPO-demo

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2-0.5B-GRPO-demo / training_args.bin

Commit History

Training in progress, step 10

08f31c7
verified

longlian commited on Feb 14

Training in progress, step 10

9583747
verified

longlian commited on Feb 14

Training in progress, step 10

21269d9
verified

longlian commited on Feb 14