jikaixuan
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions

Metrics Training metrics Community

zephyr-7b-dpo-qlora / runs /Jan13_16-49-44_uclaml03.cs.ucla.edu

4.42 kB

1 contributor

History: 1 commit

jikaixuan's picture

Training in progress, step 100

04ab470 verified over 1 year ago

events.out.tfevents.1705193567.uclaml03.cs.ucla.edu.12675.0

4.42 kB
xet

Training in progress, step 100 over 1 year ago