blacksunfm
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

End of training

2d6f45e
verified

blacksunfm commited on Mar 20

Model save

e1c8ae9
verified

blacksunfm commited on Mar 20

Training in progress, epoch 0

4fe500a
verified

blacksunfm commited on Mar 20

End of training

7efdb53
verified

blacksunfm commited on Mar 13

Model save

338b689
verified

blacksunfm commited on Mar 13

Training in progress, epoch 0

29758d6
verified

blacksunfm commited on Mar 13

initial commit

6976f4c
verified

blacksunfm commited on Mar 11