rasdani
/

Qwen-1.5B-Distill-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen-1.5B-Distill-GRPO / adapter_model.safetensors

Commit History

Training in progress, step 31

d5477ab
verified

rasdani commited on Mar 28