mimicheng
/

mistral-7b-dpo-qlora-2ep

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

mistral-7b-dpo-qlora-2ep / README.md

Commit History

End of training

56d02df
verified

mimicheng commited on Jan 19

Model save

47d1a60
verified

mimicheng commited on Jan 19