Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

22

Full-text search

Active filters: triton

wwerkk/tiny-audio-diffusion-percussion-finetuned-triton

Updated Aug 4, 2023 • 6

compressa-ai/Saiga-Llama-3-8B-OmniQuant

Text Generation • 8B • Updated Apr 23, 2024 • 16

compressa-ai/Llama-3-8B-Instruct-OmniQuant

Text Generation • 8B • Updated Apr 27, 2024

compressa-ai/Saiga-Llama-3-8B-AdaQRound

Text Generation • 8B • Updated Apr 27, 2024 • 1

compressa-ai/Llama-3-70B-Instruct-OmniQuant

Text Generation • 71B • Updated May 2, 2024 • 3

cdreetz/kwen2.5-1.5b

Text Generation • 2B • Updated Jun 4, 2025 • 8

cdreetz/kwen2.5-1.5b-v2

Text Generation • 2B • Updated Jul 17, 2025 • 1

Teen-Different/Qwen2.5-Coder-3B-KernelBook-Finetuned

3B • Updated Aug 1, 2025 • 2 • 5

ykae/monarch-bert-base-mnli-hybrid

Text Classification • 82.2M • Updated Jan 19 • 3

ykae/monarch-bert-base-mnli

Text Classification • 54.9M • Updated Jan 25 • 4

Infatoshi/kernrl-training

Reinforcement Learning • Updated Jan 20

raipolymath/triton-windows

actableai/parakeet-tdt-0.6b-v3-vi-20260125

Automatic Speech Recognition • Updated 23 days ago • 20

hkust-nlp/drkernel-8b

Text Generation • 8B • Updated 19 days ago • 118 • 4

hkust-nlp/drkernel-8b-coldstart

Text Generation • 0.3B • Updated 19 days ago • 2.36k

hkust-nlp/drkernel-14b-coldstart

Text Generation • 0.5B • Updated 19 days ago • 1.12k

hkust-nlp/drkernel-14b

Text Generation • 15B • Updated 19 days ago • 55 • 6

mradermacher/drkernel-8b-GGUF

Reinforcement Learning • 8B • Updated 19 days ago • 1.14k • 1

mradermacher/drkernel-8b-i1-GGUF

Reinforcement Learning • 8B • Updated 19 days ago • 4.11k • 1

mradermacher/drkernel-14b-GGUF

Reinforcement Learning • 15B • Updated 18 days ago • 717 • 2

mradermacher/drkernel-14b-i1-GGUF

Reinforcement Learning • 15B • Updated 18 days ago • 1.85k • 1

Joysulem/FireEcho

Text Generation • Updated 8 days ago • 8