jan-hq
/

AlphaMaze-v0.2-1.5B-GRPO-cp-800

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

AlphaMaze-v0.2-1.5B-GRPO-cp-800

1 contributor

History: 4 commits

jan-hq's picture

Trained with Unsloth

614065b verified 3 days ago