llmat
/

Qwen3-30B-A3B-NVFP4

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions

Qwen3-30B-A3B-NVFP4 / recipe.yaml

llmat's picture

Add NVFP4 quantized model for Qwen/Qwen3-30B-A3B.

dbde053 verified about 2 months ago

130 Bytes

	default_stage:
	default_modifiers:
	QuantizationModifier:
	targets: [Linear]
	ignore: [lm_head]
	scheme: NVFP4