Ejafa
/

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5 / README.md

Commit History

Update README.md

3a859d7
verified

Ejafa commited on Jun 25

End of training

27c750e
verified

Ejafa commited on Jun 21

Model save

4e7d847
verified

Ejafa commited on Jun 21