WeightOnlyInt8QuantHandler (reference) in projects: external

Searched refs:WeightOnlyInt8QuantHandler (Results 1 – 5 of 5) sorted by relevance

/external/executorch/examples/models/llama/
D	model.py	`163 from ..source_transformation.quantize import WeightOnlyInt8QuantHandler 165 simple_quantizer = WeightOnlyInt8QuantHandler(self.model_)`
/external/pytorch/benchmarks/gpt_fast/
D	quantize.py	`60 class WeightOnlyInt8QuantHandler: class`
D	generate.py	`10 WeightOnlyInt8QuantHandler as MixtralMoEWeightOnlyInt8QuantHandler, 13 from quantize import WeightOnlyInt8QuantHandler as LLaMAWeightOnlyInt8QuantHandler`
D	mixtral_moe_quantize.py	`73 class WeightOnlyInt8QuantHandler: class`
/external/executorch/examples/models/llama/source_transformation/
D	quantize.py	`74 return WeightOnlyInt8QuantHandler(model).quantized_model() 316 class WeightOnlyInt8QuantHandler(QuantHandler): class`