YYYYYYibo
/

zephyr-7b-dpo-qlora-min-pi-part-0

alignment-handbook

Generated from Trainer

Model card Files Files and versions

zephyr-7b-dpo-qlora-min-pi-part-0

Commit History

DPO-7b-beta0.01

580edf6
verified

YYYYYYibo commited on Apr 26, 2024

Model save

25285c8
verified

YYYYYYibo commited on Apr 26, 2024

Training in progress, epoch 0

415791c
verified

YYYYYYibo commited on Apr 26, 2024

DPO-7b-beta0.01

26517f2
verified

YYYYYYibo commited on Apr 26, 2024

Model save

4738e8b
verified

YYYYYYibo commited on Apr 26, 2024

Training in progress, epoch 0

b03cb12
verified

YYYYYYibo commited on Apr 26, 2024

DPO-7b-beta0.01

96a9f4c
verified

YYYYYYibo commited on Apr 26, 2024

Model save

bc59731
verified

YYYYYYibo commited on Apr 26, 2024

DPO-7b-beta0.01

217283b
verified

YYYYYYibo commited on Apr 26, 2024

Model save

8f2b315
verified

YYYYYYibo commited on Apr 26, 2024

initial commit

9733d54
verified

YYYYYYibo commited on Apr 26, 2024