nvidia
/

Llama-3.3-70B-Instruct-FP8

Model card Files Files and versions Community

Update README.md

#2

by RestingCodeFace - opened May 8

base: refs/heads/main

←

from: refs/pr/2

Discussion Files changed

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -27,7 +27,7 @@ Developers looking to take off the shelf pre-quantized models for deployment <br
 Huggingface 05/09/2025 via https://huggingface.co/nvidia/Llama-3.3-70B-Instruct-FP8 <br>
 ## Model Architecture:
-**Architecture Type:** Transformers  <br>
 **Network Architecture:** Llama3.3 <br>
 ## Input:
@@ -61,8 +61,8 @@ The model is quantized with nvidia-modelopt **v0.23.0**  <br>
 ## Datasets:
 * Calibration Dataset: [cnn_dailymail](https://huggingface.co/datasets/abisee/cnn_dailymail) <br>
-** Data collection method: Automated. <br>
-** Labeling method: Unknown. <br>
 ## Inference:

 Huggingface 05/09/2025 via https://huggingface.co/nvidia/Llama-3.3-70B-Instruct-FP8 <br>
 ## Model Architecture:
+**Architecture Type:** Transformer  <br>
 **Network Architecture:** Llama3.3 <br>
 ## Input:
 ## Datasets:
 * Calibration Dataset: [cnn_dailymail](https://huggingface.co/datasets/abisee/cnn_dailymail) <br>
+** Data collection method: Automated <br>
+** Labeling method: Unknown <br>
 ## Inference: