AzalKhan
/

Qwen2.5-1.5B-Instruct_open-r1-DAPO-Math-17k-Processed_588

Reinforcement Learning

text-generation

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Instruct_open-r1-DAPO-Math-17k-Processed_588

6.19 GB

1 contributor

History: 6 commits

AzalKhan's picture

Upload folder using huggingface_hub

4b1cb86 verified 13 days ago