GY2233
/

Qwen2.5-7B-Instruct-NVFP4A16

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions

Qwen2.5-7B-Instruct-NVFP4A16 / recipe.yaml

GY2233's picture

Upload Qwen2ForCausalLM

a07cdc8 verified 3 months ago

133 Bytes

	default_stage:
	default_modifiers:
	QuantizationModifier:
	targets: [Linear]
	ignore: [lm_head]
	scheme: NVFP4A16