JakeOh
/

llama-3.2-1b-gsm8k-step-1-dpo

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

llama-3.2-1b-gsm8k-step-1-dpo / README.md

Commit History

Model save

4c4e9a9
verified

JakeOh commited on 1 day ago