ArtusDev/alpindale_goliath-120b-EXL3

EXL3 Quants of alpindale/goliath-120b

EXL3 quants of alpindale/goliath-120b using exllamav3 for quantization.

Quant(Revision)	Bits per Weight	Head Bits
1.8_H5	1.8	5
2.0_H4	2.0	4

Click to view download instructions

Install hugginface-cli:

pip install -U "huggingface_hub[cli]"

Download quant by targeting the specific quant revision (branch):

huggingface-cli download ArtusDev/alpindale_goliath-120b-EXL3 --revision "5.0bpw_H6" --local-dir ./