Ejafa
/

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5

Commit History

Update README.md

3a859d7
verified

Ejafa commited on Jun 25

End of training

27c750e
verified

Ejafa commited on Jun 21

Model save

4e7d847
verified

Ejafa commited on Jun 21

initial commit

2f0a1df
verified

Ejafa commited on Jun 21