Models

140

Full-text search

Active filters: cuda

prism-ml/Bonsai-8B-gguf

Text Generation • 8B • Updated 6 days ago • 105k • 669

prism-ml/Bonsai-1.7B-gguf

Text Generation • 2B • Updated 6 days ago • 22.5k • 65

prism-ml/Bonsai-4B-gguf

Text Generation • 4B • Updated 6 days ago • 15k • 40

atomicmilkshake/llama-cpp-turboquant-binaries

Updated 16 days ago • 3

ValiantLabs/gemma-4-E2B-it-ShiningValiant3

Image-Text-to-Text • 5B • Updated 12 days ago • 36 • 3

ValiantLabs/gemma-4-E4B-it-ShiningValiant3

Image-Text-to-Text • 8B • Updated 12 days ago • 28 • 4

ValiantLabs/gpt-oss-20b-ShiningValiant3

Text Generation • 21B • Updated Dec 9, 2025 • 17 • 19

dougeeai/llama-cpp-python-wheels

Updated Nov 9, 2025 • 8

Multilingual-Multimodal-NLP/IndustrialCoder

Text Generation • 32B • Updated 28 days ago • 1.2k • 58

pranay5255/flash-attn-v2-ampere

Updated 10 days ago • 1

ussoewwin/Flash-Attention-2_for_Windows

Updated 27 days ago • 93

elinas/chronos-13b-4bit

Text Generation • Updated Jun 23, 2023 • 10 • 23

CalderaAI/13B-Ouroboros-GPTQ4bit-128g-CUDA

Text Generation • Updated Jul 20, 2023 • 10

marcorez8/llama-cpp-python-windows-blackwell-cuda

Updated Jun 2, 2025 • 4

Prince-1/sarvam-m-onnx

Updated Jun 14, 2025 • 1

ValiantLabs/Qwen3-8B-ShiningValiant3

Text Generation • 8B • Updated Dec 9, 2025 • 14 • 3

mradermacher/Qwen3-8B-ShiningValiant3-GGUF

8B • Updated Jul 8, 2025 • 1.51k • 2

mradermacher/Qwen3-8B-ShiningValiant3-i1-GGUF

8B • Updated Jul 11, 2025 • 2.41k • 2

ValiantLabs/Qwen3-1.7B-ShiningValiant3

Text Generation • 2B • Updated Dec 9, 2025 • 28 • 5

mradermacher/Qwen3-1.7B-ShiningValiant3-GGUF

2B • Updated Jul 11, 2025 • 196

mradermacher/Qwen3-1.7B-ShiningValiant3-i1-GGUF

2B • Updated Jul 11, 2025 • 425

ValiantLabs/Qwen3-4B-ShiningValiant3

Text Generation • 4B • Updated Dec 9, 2025 • 34 • 7

sequelbox/Qwen3-8B-PlumEsper

Text Generation • 8B • Updated Jul 14, 2025 • 3

sequelbox/Qwen3-4B-PlumEsper

Text Generation • 4B • Updated Jul 15, 2025 • 3

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-GGUF

3B • Updated Jul 27, 2025 • 198 • 2

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-GGUF

2B • Updated Jul 27, 2025 • 155

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-GGUF

2B • Updated Jul 27, 2025 • 131

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-i1-GGUF

2B • Updated Dec 18, 2025 • 128 • 1

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-i1-GGUF

2B • Updated Dec 18, 2025 • 597

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-i1-GGUF

3B • Updated Dec 18, 2025 • 523 • 1