llavallava
/

qwen2.5-3b-instruct-trl-sft-lora-social_debug

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

qwen2.5-3b-instruct-trl-sft-lora-social_debug / vocab.json

Commit History

Training in progress, step 20

d090b8a
verified

llavallava commited on Feb 3