Blancy
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO / generation_config.json

Commit History

Model save

169ab19
verified

Blancy commited on May 26

Model save

432af8b
verified

Blancy commited on May 18

Model save

69bc205
verified

Blancy commited on May 15

Model save

7869312
verified

Blancy commited on Apr 14