RedHatAI
/

Meta-Llama-3.1-8B-Instruct-FP8-dynamic

Text Generation

8-bit precision

compressed-tensors

text-generation-inference

Model card Files Files and versions

robgreenberg3 commited on 21 days ago

Commit

cd26f36

·

verified ·

1 Parent(s): dc7738d

Update README.md

Files changed (1) hide show

README.md +24 -5

README.md CHANGED Viewed

@@ -1,7 +1,4 @@
 ---
-tags:
-- fp8
-- vllm
 language:
 - en
 - de
@@ -11,9 +8,31 @@ language:
 - hi
 - es
 - th
 pipeline_tag: text-generation
-license: llama3.1
-base_model: meta-llama/Meta-Llama-3.1-8B-Instruct
 ---
 <h1 style="display: flex; align-items: center; gap: 10px; margin: 0;">
   Meta-Llama-3.1-8B-Instruct-FP8-dynamic

 ---
 language:
 - en
 - de
 - hi
 - es
 - th
+base_model:
+- meta-llama/Llama-3.1-8B-Instruct
 pipeline_tag: text-generation
+tags:
+- llama
+- facebook
+- meta
+- llama-3
+- int8
+- vllm
+- chat
+- neuralmagic
+- llmcompressor
+- conversational
+- 8-bit precision
+- compressed-tensors
+license: other
+license_name: llama3.1
+name: RedHatAI/Meta-Llama-3.1-8B-Instruct-quantized.w8a8
+description: This model was obtained by quantizing the weights and activations of Meta-Llama-3.1-8B-Instruct to INT8 data type.
+readme: https://huggingface.co/RedHatAI/Meta-Llama-3.1-8B-Instruct-quantized.w8a8/main/README.md
+tasks:
+- text-to-text
+provider: Meta
+license_link: https://github.com/meta-llama/llama-models/blob/main/models/llama3_1/LICENSE
 ---
 <h1 style="display: flex; align-items: center; gap: 10px; margin: 0;">
   Meta-Llama-3.1-8B-Instruct-FP8-dynamic