Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

2,370

Full-text search

Active filters: quantized

mzbac/flux1.dev.4bit.mlx

Text-to-Image • Updated 11 days ago

langtech-innovation/AL40b-dev-Q8-gguf

Text Generation • 40B • Updated 9 days ago • 23

mzbac/flux1.schnell.8bit.mlx

Text-to-Image • Updated 11 days ago

mzbac/flux1.dev.8bit.mlx

Text-to-Image • Updated 11 days ago

steampunque/gemma-3-4b-it-Hybrid-GGUF

0.4B • Updated 12 days ago • 26

mzbac/flux1.kontext.8bit.mlx

Image-to-Image • Updated 11 days ago

steampunque/Qwen2.5-VL-3B-Instruct-Hybrid-GGUF

0.7B • Updated 12 days ago • 26

magicunicorn/kokoro-npu-quantized

Text-to-Speech • Updated 6 days ago

Parveshiiii/mistral-small-int8

Text Generation • 7B • Updated 8 days ago • 9 • 1

fedora-copr/Mistral-7B-Instruct-v0.3-GGUF

Text Generation • 7B • Updated 8 days ago • 66

ReallyFloppyPenguin/Llama-3.1-Centaur-70B-GGUF

Updated 8 days ago

ReallyFloppyPenguin/Dhanishtha-2.0-preview-GGUF

Updated 8 days ago

ReallyFloppyPenguin/DeepSeek-R1-Distill-Qwen-1.5B-GGUF

2B • Updated 8 days ago • 112

ReallyFloppyPenguin/DeepSWE-Preview-GGUF

33B • Updated 8 days ago • 92

crazymaker1122/Llama-3.3-8B-Instruct-awq-direct

Text Generation • 2B • Updated 8 days ago • 11

steampunque/Llama-3.1-8B-Instruct-Hybrid-GGUF

8B • Updated 7 days ago • 4

steampunque/Llama-3.3-70B-Instruct-Hybrid-GGUF

71B • Updated 6 days ago • 81

steampunque/ultravox-v0_5-llama-3_3-70b-Hybrid-GGUF

0.7B • Updated 6 days ago • 11

steampunque/ultravox-v0_6-llama-3_3-70b-Hybrid-GGUF

0.7B • Updated 6 days ago • 13

magicunicorn/gemma-3-27b-npu-quantized

Text Generation • Updated 6 days ago

rs-test/llama-scout-fp8

Image-Text-to-Text • 109B • Updated 5 days ago • 240

JonathanMiddleton/Qwen3-Embedding-8B-GGUF

8B • Updated 3 days ago • 87

Makatia/mistral-7b-instruct-v0.2.Q8_0-Q8_0.gguf

7B • Updated 3 days ago • 16

Makatia/microsoft_Phi-3-mini-4k-instruct_onnx_rpi

Updated 3 days ago

JonathanMiddleton/Qwen3-Reranker-4B-GGUF

Text Ranking • 4B • Updated 3 days ago • 20

ramblingpolymath/Qwen3-32B-W8A8

Text Generation • 33B • Updated 2 days ago

steampunque/Deepseek-R1-Distill-Llama-8B-Hybrid-GGUF

8B • Updated 2 days ago • 5

adamrb/mpt-30b-chat-w4a16-gptq

4B • Updated 1 day ago

adamrb/mpt-30b-chat-w8a8-gptq

8B • Updated 1 day ago

tcpipuk/DavidAU-Gemma-3-4b-it-Uncensored-DBL-X-GGUF

Text Generation • 4B • Updated about 2 hours ago