Ejafa
/

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5 / runs /Jun21_14-04-01_131-186-38-174

1 contributor

History: 2 commits

Ejafa's picture

End of training

27c750e verified 5 months ago

events.out.tfevents.1718979292.131-186-38-174.21907.0

70.6 kB
LFS

Model save 5 months ago
events.out.tfevents.1718982473.131-186-38-174.21907.1

828 Bytes
LFS

End of training 5 months ago