Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

cerebras/SlimPajama-627B

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

659

Full-text search

Active filters: cerebras/SlimPajama-627B

punk778/TinyLlama-1.1B-Chat-v1.0-Q8_0-GGUF

1B • Updated Sep 4, 2024 • 22

punk778/TinyLlama_v1.1-Q8_0-GGUF

1B • Updated Sep 4, 2024 • 6

Felladrin/gguf-q5_k_m-tinydolphin-2.8.2-1.1b-laser

1B • Updated Sep 5, 2024 • 4

WTNLXTBL/TinyLlama_v1.1_chinese-Q4_K_M-GGUF

1B • Updated Sep 16, 2024 • 2

blockblockblock/TinyLlama_TinyLlama-1.1B-Chat-v1.0-bpw2.25-exl2

Updated Sep 18, 2024 • 2

QuantFactory/TinyLlama-1.1B-Chat-v0.6-GGUF

1B • Updated Sep 21, 2024 • 147 • 2

Felladrin/gguf-Q5_K_M-TinyLlama-1.1B-Chat-v1.0

1B • Updated Sep 22, 2024 • 11

QuantFactory/AMD-Llama-135m-GGUF

0.1B • Updated Oct 6, 2024 • 192 • 3

Solshine/AMD-Llama-135m-code-Q4_K_M-GGUF

0.1B • Updated Sep 27, 2024 • 4

Solshine/AMD-Llama-135m-code-Q8_0-GGUF

0.1B • Updated Sep 27, 2024 • 6

Solshine/AMD-Llama-135m-Q8_0-GGUF

0.1B • Updated Sep 27, 2024 • 7

Solshine/AMD-Llama-135m-Q4_K_M-GGUF

0.1B • Updated Sep 27, 2024 • 6

Solshine/AMD-Llama-135m-Q2_K-GGUF

0.1B • Updated Sep 27, 2024 • 10

bartowski/AMD-Llama-135m-GGUF

Text Generation • 0.1B • Updated Sep 28, 2024 • 302 • 3

antoste/AMD-Llama-135m-Q8_0-GGUF

0.1B • Updated Sep 29, 2024 • 10

YorkieOH10/AMD-Llama-135m-Q8_0-GGUF

0.1B • Updated Sep 29, 2024 • 9

YorkieOH10/AMD-Llama-135m-code-Q8_0-GGUF

0.1B • Updated Sep 29, 2024 • 6

bartowski/AMD-Llama-135m-code-GGUF

Text Generation • 0.1B • Updated Sep 29, 2024 • 211

Frogbert/TinyLlama_v1.1-Q4_K_M-GGUF

1B • Updated Oct 2, 2024 • 4

WTNLXTBL/TinyLlama-1.1B-Chat-v1.0-Q4_K_M-GGUF

1B • Updated Oct 2, 2024 • 3

QuantFactory/AMD-Llama-135m-code-GGUF

0.1B • Updated Oct 3, 2024 • 149 • 2

lopezjhonf/TinyLlama_v1.1-Q2_K-GGUF

1B • Updated Oct 3, 2024 • 5

mav23/AMD-Llama-135m-GGUF

0.1B • Updated Oct 3, 2024 • 330

mlx-community/AMD-Llama-135m

0.1B • Updated Oct 3, 2024 • 3

mlx-community/AMD-Llama-135m-4bit

0.0B • Updated Oct 3, 2024 • 3

mlx-community/AMD-Llama-135m-8bit

0.0B • Updated Oct 3, 2024 • 2

mlx-community/AMD-Llama-135m-float16

0.1B • Updated Oct 3, 2024 • 5

mlx-community/AMD-Llama-135m-float32

0.1B • Updated Oct 3, 2024 • 4

mlx-community/AMD-Llama-135m-bfloat16

0.1B • Updated Oct 3, 2024 • 3

mlx-community/AMD-Llama-135m-code

0.1B • Updated Oct 3, 2024 • 8