Blancy
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO / tokenizer.json

Commit History

Training in progress, epoch 1

f9555a5
verified

Blancy commited on May 26

Training in progress, step 62

82c90dd
verified

Blancy commited on May 18

Training in progress, step 178

415c617
verified

Blancy commited on Apr 27

Model save

266f1a2
verified

Blancy commited on Apr 27

Training in progress, epoch 0

4c7ed6b
verified

Blancy commited on Apr 14