dctanner
/

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized / README.md

Commit History

End of training

fc9d379
verified

dctanner commited on Jan 24, 2024

Model save

609f4da
verified

dctanner commited on Jan 24, 2024

End of training

95d3ec2
verified

dctanner commited on Jan 18, 2024

Model save

e291de3
verified

dctanner commited on Jan 18, 2024