neuralmagic
/

granite-3.1-2b-base-quantized.w8a8

Text Generation

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

granite-3.1-2b-base-quantized.w8a8

3 contributors

History: 12 commits

nm-research's picture

Update README.md

4032746 verified about 8 hours ago