VictorZheng
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

Training in progress, epoch 1

0cf24b6
verified

VictorZheng commited on Jul 28

initial commit

7626b1a
verified

VictorZheng commited on Jul 28