MidnightPhreaker
/

KAT-Dev-72B-Exp-GPTQ-INT4-gs32-0.01

compressed-tensors

Model card Files Files and versions

KAT-Dev-72B-Exp-GPTQ-INT4-gs32-0.01 / recipe.yaml

Shane

Upload GPTQ quantized model (group_size=32)

0f4738f verified about 1 month ago

history blame contribute delete

363 Bytes

	default_stage:
	default_modifiers:
	GPTQModifier:
	config_groups:
	group_0:
	targets: [Linear]
	weights: {num_bits: 4, type: int, symmetric: true, group_size: 32, strategy: group,
	observer: minmax}
	input_activations: null
	output_activations: null
	ignore: [lm_head]
	dampening_frac: 0.1