Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

70

Full-text search

Active filters: VPTQ

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v16-k65536-32768-woft

7B • Updated Feb 25 • 6

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-65536-woft

2B • Updated Mar 20 • 9

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-4096-woft

2B • Updated Mar 20 • 8

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-256-woft

2B • Updated Mar 20 • 12

VPTQ-community/Qwen2.5-72B-Instruct-v16-k65536-65536-woft

8B • Updated Feb 25 • 4 • 4

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v16-k65536-65536-woft

8B • Updated Feb 25 • 23

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-256-woft

9B • Updated Feb 25 • 6 • 1

VPTQ-community/Qwen2.5-7B-Instruct-v8-k65536-256-woft

2B • Updated Mar 20 • 10

VPTQ-community/Qwen2.5-72B-Instruct-v16-k65536-32768-woft

8B • Updated Feb 25 • 5 • 3

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k32768-0-woft

6B • Updated Feb 25 • 11 • 1

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-65536-woft

11B • Updated Feb 25 • 5 • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k16384-0-woft

6B • Updated Feb 25 • 8 • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-0-woft

7B • Updated Feb 25 • 68 • 2

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-4-woft-duplicated

8B • Updated Feb 25 • 6 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-1024-woft

26B • Updated Feb 25 • 8 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v8-k4096-0-woft

23B • Updated Feb 25 • 11 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-64-woft

22B • Updated Feb 25 • 10 • 3

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k32768-32768-woft

29B • Updated Feb 26 • 6 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-128-woft

23B • Updated Feb 25 • 7 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-4-woft

8B • Updated Feb 25 • 8 • 2

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-0-woft

7B • Updated Feb 25 • 5 • 2

VPTQ-community/Qwen2.5-72B-Instruct-v8-k512-512-woft

7B • Updated Feb 25 • 8 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k1024-512-woft

8B • Updated Feb 25 • 5 • 2

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-256-woft

24B • Updated Feb 25 • 10 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-256-woft

9B • Updated Feb 25 • 5 • 4

VPTQ-community/Qwen2.5-14B-Instruct-v8-k256-256-woft

2B • Updated Mar 20 • 4

VPTQ-community/Qwen2.5-14B-Instruct-v16-k65536-65536-woft

3B • Updated Mar 20 • 3

VPTQ-community/Qwen2.5-14B-Instruct-v8-k65536-256-woft

3B • Updated Mar 20 • 3

VPTQ-community/Qwen2.5-14B-Instruct-v8-k65536-0-woft

3B • Updated Mar 20 • 4

VPTQ-community/Qwen2.5-14B-Instruct-v8-k65536-65536-woft

4B • Updated Mar 20 • 3