tphage
/

Llama-3.2-1B-Instruct-GRPO-250802

Generated from Trainer

Model card Files Files and versions

Llama-3.2-1B-Instruct-GRPO-250802 / adapter_model.safetensors

Commit History

Training in progress, step 100

7f00b84
verified

tphage commited on Aug 3

Training in progress, step 90

5bd96cc
verified

tphage commited on Aug 3

Training in progress, step 80

7ef4876
verified

tphage commited on Aug 3

Training in progress, step 70

099cfb0
verified

tphage commited on Aug 3

Training in progress, step 60

2e5bafb
verified

tphage commited on Aug 3

Training in progress, step 50

c3e0ea8
verified

tphage commited on Aug 3

Training in progress, step 40

45cbe77
verified

tphage commited on Aug 3

Training in progress, step 30

2c9bca2
verified

tphage commited on Aug 3

Training in progress, step 20

b23a29f
verified

tphage commited on Aug 3

Training in progress, step 10

5f8c43d
verified

tphage commited on Aug 3

Training in progress, step 10

aecbb79
verified

tphage commited on Aug 3