lindafei001
/

llama-8b-instruct-safeRLHF-dpo-10epochs-1e-5-64-128-0.5

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

llama-8b-instruct-safeRLHF-dpo-10epochs-1e-5-64-128-0.5

9.15 GB

1 contributor

History: 2 commits

lindafei001's picture

Upload trained model checkpoint

07c1037 verified 2 months ago