AaronHuangWei
/

Qwen2.5-7B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-GRPO

Commit History

End of training

b8c3166
verified

AaronHuangWei commited on 10 days ago

Model save

09557c1
verified

AaronHuangWei commited on 10 days ago

initial commit

8b30f9e
verified

AaronHuangWei commited on 10 days ago