Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

compressed-tensors

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

3,044

Full-text search

Active filters: compressed-tensors

nm-testing/Llama-3.1-8B-Instruct-QKV-FP8-tensor-static_minmax

8B • Updated 9 days ago • 15

nm-testing/Llama-3.1-8B-Instruct-KV-FP8-tensor-static_minmax

8B • Updated 9 days ago • 41

nm-testing/Llama-3.1-8B-Instruct-KV-FP8-attn_head-static_minmax

8B • Updated 9 days ago • 11

nm-testing/Llama-3.1-8B-Instruct-QKV-FP8-attn_head-static_minmax

8B • Updated 9 days ago • 14

syntheticlab/GLM-4.6-NVFP4

201B • Updated 9 days ago • 240

MidnightPhreaker/KAT-Dev-72B-Exp-GPTQ-INT4-gs32-0.01

13B • Updated 9 days ago • 1

MidnightPhreaker/KAT-Dev-72B-Exp-GPTQ-INT4-gs32

13B • Updated 9 days ago • 91

MidnightPhreaker/KAT-Dev-72B-Exp-GPTQ-INT4-gs128

12B • Updated 9 days ago • 448

Firworks/Llama-3.1-8B-Instruct-nvfp4

5B • Updated 7 days ago • 42

bash99/Qwen3-30B-A3B-Instruct-2507-FP8-Dynamic

Text Generation • 31B • Updated 7 days ago • 42

GaleneAI/llama-3.1-nemoguard-8b-content-safety-merged-FP8-Dynamic

8B • Updated 8 days ago • 243

cerebras/GLM-4.6-REAP-268B-A32B-FP8

Text Generation • 269B • Updated 8 days ago • 216 • 4

MidnightPhreaker/DeepSeek-Coder-33B-Instruct-NVFP4

19B • Updated 8 days ago • 23

mratsim/Wayfarer-Large-70B-NVFP4

Text Generation • 41B • Updated 5 days ago • 45

RedHatAI/Llama-3.1-8B-Instruct-NVFP4

Text Generation • 5B • Updated 2 days ago • 33

RedHatAI/Qwen3-14B-NVFP4

Text Generation • 9B • Updated 1 day ago • 28

RedHatAI/Qwen3-8B-NVFP4

Text Generation • 5B • Updated 2 days ago • 102

joedonino/beni_qwen4b_product_102225-fp8

Image-to-Text • 5B • Updated 8 days ago • 43

RedHatAI/Mistral-Small-3.2-24B-Instruct-2506-NVFP4

Text Generation • 14B • Updated 2 days ago • 40

nm-testing/Llama-4-Maverick-17B-128E-Instruct-block-FP8

Text Generation • Updated 4 days ago • 408

mratsim/Nova-70B-NVFP4

Text Generation • 41B • Updated 5 days ago • 131

mratsim/Anubis-70B-v1.1-NVFP4

Text Generation • 41B • Updated 5 days ago • 75

mratsim/L3.3-Ignition-v0.1-70B-NVFP4

Text Generation • 41B • Updated 5 days ago • 13

mratsim/GoldDiamondGold-L33-70B-NVFP4

Text Generation • 41B • Updated 5 days ago • 26

mratsim/Strawberrylemonade-L3-70B-v1.1-NVFP4

Text Generation • 41B • Updated 5 days ago • 15

CPU-Hybrid-MoE/GLM-4.5-Air-GPU-weight

32B • Updated 7 days ago • 13

AngelSlim/Glm4_6-fp8_static

353B • Updated 2 days ago • 526

CPU-Hybrid-MoE/DeepSeek-V3-0324-GPU-FP8-GPTQ4

Text Generation • 106B • Updated 7 days ago • 3

reinforce20001/Sakura-GalTransl-14B-v3.8-NVFP4

9B • Updated 7 days ago • 19

reinforce20001/Sakura-GalTransl-14B-v3.8-W8A8-Int8

15B • Updated 7 days ago • 20