XueyingJia
/

pythia-1b-online-dpo-ground-truth-lead

Generated from Trainer

Model card Files Files and versions Community

pythia-1b-online-dpo-ground-truth-lead

Ctrl+K

Ctrl+K

1 contributor

History: 28 commits

XueyingJia's picture

End of training

584afcf verified 6 months ago