Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

3

Full-text search

Active filters: 8 bit

Trelis/Llama-2-7b-chat-hf-hosted-inference-8bit

Text Generation • 7B • Updated Nov 9, 2023 • 23 • 7

Trelis/mpt-7b-instruct-hosted-inference-8bit

Text Generation • Updated Aug 14, 2023 • 9

iqbalamo93/Meta-Llama-3.1-8B-Instruct-GPTQ-Q_8

Text Generation • 3B • Updated Sep 14, 2024 • 2.61k • 3