Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

239

Full-text search

Active filters: openai/gsm8k

fblgit/miniclaus-qw1.5B-UNAMGS-GRPO

Text Generation • 2B • Updated Feb 6 • 3 • 5

mradermacher/miniclaus-qw1.5B-UNAMGS-GRPO-GGUF

2B • Updated Feb 6 • 53 • 1

kasinadhsarma/vishwamai-model

Text Generation • Updated Feb 17

mradermacher/prem-1B-grpo-GGUF

Reinforcement Learning • 1B • Updated Feb 5 • 68

prithivMLmods/Feynman-Grpo-Exp

Text Generation • 0.5B • Updated Feb 7 • 6 • 1

prithivMLmods/Feynman-Grpo-Exp-GGUF

Text Generation • 0.5B • Updated Feb 7 • 9 • 2

tecosys/Nutaan-RL1

Reinforcement Learning • Updated Feb 7 • 526

miike-ai/Llama-3.1-8b-gsm8k-r

EpistemeAI/ReasoningCore-3B-0

Text Generation • 3B • Updated Feb 27 • 246 • 2

hooman650/MedQwen3B-Reasoner

Text Generation • 3B • Updated Feb 11 • 130 • 13

SunJack/Qwen2.5-3B-R1

Updated Mar 7 • 5

dbands/Qwen2.5-3B-Instruct-reason-gguf

3B • Updated Feb 8 • 7

Nagi-ovo/Qwen2.5-7B-Reasoning-Adapter

Text Generation • Updated Feb 8 • 4

dbands/Qwen2.5-Coder-7B-Instruct-reason-gguf

8B • Updated Feb 11 • 18

dbands/Qwen2.5-Coder-14B-Instruct-reason

Text Generation • 15B • Updated Feb 9 • 5 • 1

dbands/Qwen2.5-Coder-14B-Instruct-reason-gguf

15B • Updated Feb 9 • 15

Danielbrdz/Barcenas-3b-GRPO

Text Generation • 3B • Updated Feb 8 • 3

manavg/granite-grpo-gsm8k-40pct

Text Generation • 3B • Updated Feb 10 • 10 • 1

mradermacher/ReasoningCore-3B-0-GGUF

3B • Updated Feb 11 • 49

mradermacher/Barcenas-3b-GRPO-GGUF

3B • Updated Feb 10 • 80

mradermacher/ReasoningCore-3B-0-i1-GGUF

3B • Updated Feb 11 • 127

mradermacher/Qwen2.5-Coder-14B-Instruct-reason-GGUF

15B • Updated Feb 10 • 148 • 2

alpha-ai/qwen2.5-reason-thought-lite-GGUF

3B • Updated Apr 28 • 10

mradermacher/Feynman-Grpo-Exp-GGUF

0.5B • Updated Feb 9 • 53

alpha-ai/qwen2.5-reason-thought-lite

Text Generation • 3B • Updated Apr 28 • 7

ununtrium/Qwen2.5-1.5B-Instruct-Open-R1-GRPO-gsm8k2

Text Generation • 2B • Updated Feb 9 • 4

alpha-ai/llama-3.2-3B-Reason-Reflect-Lite-GGUF

3B • Updated Feb 26 • 12 • 1

alpha-ai/llama-3.2-3B-Reason-Reflect-Lite

Text Generation • 3B • Updated Feb 26 • 6

mradermacher/Barcenas-3b-GRPO-i1-GGUF

3B • Updated Feb 10 • 85

mradermacher/Cogito-R1-GGUF

33B • Updated Feb 12 • 161