Kadins
/

DeepSeek-R1-Distill-Qwen-7B-GRPO-v8

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-GRPO-v8 / training_args.bin

Commit History

Training in progress, step 385

01d412e
verified

Kadins commited on Mar 19

Training in progress, step 300

d79b464
verified

Kadins commited on Mar 18

Training in progress, step 50

b5a5bb7
verified

Kadins commited on Mar 17