AaronHuangWei
/

Qwen2.5-7B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-GRPO / .gitattributes

Commit History

Model save

09557c1
verified

AaronHuangWei commited on 10 days ago

initial commit

8b30f9e
verified

AaronHuangWei commited on 10 days ago