dctanner
/

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized / runs /Jan23_20-43-15_dpo-tests-2-85c5c9854f-p9wdp

Commit History

Model save

609f4da
verified

dctanner commited on Jan 24, 2024

Training in progress, step 1000

dc83227
verified

dctanner commited on Jan 24, 2024

Training in progress, step 800

05ab8b0
verified

dctanner commited on Jan 23, 2024

Training in progress, step 700

d7820c6
verified

dctanner commited on Jan 23, 2024

Training in progress, step 600

87bc27e
verified

dctanner commited on Jan 23, 2024

Training in progress, step 500

9251d4b
verified

dctanner commited on Jan 23, 2024

Training in progress, step 400

9899d0d
verified

dctanner commited on Jan 23, 2024

Training in progress, step 300

28dac84
verified

dctanner commited on Jan 23, 2024

Training in progress, step 200

0558b18
verified

dctanner commited on Jan 23, 2024

Training in progress, step 100

d6f96a3
verified

dctanner commited on Jan 23, 2024