Quantized with AutoAWQ v0.2.8 using default settings

    quant_config = {
        "zero_point": True,
        "q_group_size": 128,
        "w_bit": 4,
        "version": "GEMM"
    }

Safetensors

Model size

5.73B params

Tensor type

I32

BF16

F16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for CAPsMANyo/DeepSeekR1-Qwen2.5-Coder-32B-Preview-AWQ

Base model

Quantized

(16)

this model