Edit Models filters

Inference status

Misc

arxiv: 2210.17323

AutoTrain Compatible

text-generation-inference

Inference Endpoints

4-bit precision

8-bit precision

Carbon Emissions

Misc with no match

text-embeddings-inference

Mixture of Experts

Models

114

Full-text search

Active filters: 2210.17323

neuralmagic/Mistral-Nemo-Instruct-2407-quantized.w4a16

Text Generation • Updated Oct 9 • 812 • 2

neuralmagic/gemma-2-2b-it-quantized.w8a8

Text Generation • Updated Oct 9 • 390

neuralmagic/Meta-Llama-3.1-405B-Instruct-quantized.w8a16

Text Generation • Updated Oct 9 • 560 • 2

neuralmagic/SmolLM-360M-Instruct-quantized.w8a8

Text Generation • Updated Oct 9 • 15

neuralmagic/SmolLM-135M-Instruct-quantized.w8a8

Text Generation • Updated Oct 9 • 659

nm-testing/SmolLM-135M-Instruct-quantized.w4a16

Text Generation • Updated Oct 9 • 14

nm-testing/SmolLM-1.7B-Instruct-quantized.w4a16

Text Generation • Updated Oct 9 • 10

neuralmagic/SmolLM-1.7B-Instruct-quantized.w8a8

Text Generation • Updated Oct 9 • 18

zzzmahesh/Meta-Llama-3-8B-Instruct-quantized.w8a8

Text Generation • Updated Sep 7 • 8

zzzmahesh/Meta-Llama-3-8B-Instruct-quantized.w4a4

Text Generation • Updated Sep 3 • 27

IntelLabs/sqft-phi-3-mini-4k-instruct-base-gptq

Text Generation • Updated 17 days ago • 3

iproskurina/opt-125m-GPTQ-4bit-g128

Text Generation • Updated Sep 24 • 24

iproskurina/Mistral-7B-v0.1-GPTQ-4bit-g128

Text Generation • Updated Sep 24 • 12

iproskurina/Mistral-7B-v0.1-GPTQ-8bit-g128

Text Generation • Updated Sep 24 • 33

iproskurina/Mistral-7B-v0.1-GPTQ-3bit-g128

Text Generation • Updated Sep 24 • 14

iproskurina/Mistral-7B-v0.1-GPTQ-3bit-g64

Text Generation • Updated Sep 24 • 13

iproskurina/Mistral-7B-v0.1-GPTQ-8bit-g64

Text Generation • Updated Sep 24 • 15

iproskurina/Mistral-7B-v0.3-GPTQ-4bit-g128

Text Generation • Updated Sep 25 • 23

iproskurina/Mistral-7B-v0.3-GPTQ-8bit-g128

Text Generation • Updated Sep 25 • 20

neuralmagic/Llama-3.2-3B-Instruct-quantized.w8a8

Text Generation • Updated Oct 16 • 1.61k • 1

IntelLabs/sqft-phi-3.5-mini-instruct-base-gptq

Text Generation • Updated 17 days ago • 3

BSC-LT/salamandra-7b-base-gptq

Text Generation • Updated 10 days ago • 26

BSC-LT/salamandra-7b-instruct-gptq

Text Generation • Updated 10 days ago • 53

BSC-LT/salamandra-2b-base-gptq

Text Generation • Updated 10 days ago • 83