abaryan
/

GRPO_GSM8K_Qwen2.5-1.5B_NoQuantisation

Reinforcement Learning

text-generation

text-generation-inference

Model card Files Files and versions Community

GRPO_GSM8K_Qwen2.5-1.5B_NoQuantisation / merges.txt

Abaryan

Upload tokenizer

69a6f42 verified 3 months ago

history contribute delete

1.67 MB

File too large to display, you can check the raw version instead.