EllieS
/

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old / runs

Ctrl+K

Ctrl+K

1 contributor

History: 8 commits

EllieS's picture

Model save

8c89d20 verified over 1 year ago

Feb23_07-46-59_586cb8b6da8c
Model save over 1 year ago