1# OH_NN_QuantParam 2<!--Kit: Neural Network Runtime Kit--> 3<!--Subsystem: AI--> 4<!--Owner: @GbuzhidaoR--> 5<!--Designer: @GbuzhidaoR--> 6<!--Tester: @GbuzhidaoR--> 7<!--Adviser: @ge-yafang--> 8 9## 概述 10 11量化信息。 12 13在量化的场景中,32位浮点型数据根据以下公式量化为定点数据: 14 15 16 17其中s和z是量化参数,在OH_NN_QuanParam中通过scale和zeroPoint保存,r是浮点数,q是量化后的结果,q_min是量化后下界,q_max是量化后的上界,计算方式如下: 18 19 20 21 22 23clamp函数定义如下: 24 25 26 27**起始版本:** 9 28 29**废弃版本:** 11 30 31**替代接口:** [NN_QuantParam](capi-neuralnetworkruntime-nn-quantparam.md) 32 33**相关模块:** [NeuralNetworkRuntime](capi-neuralnetworkruntime.md) 34 35**所在头文件:** [neural_network_runtime_type.h](capi-neural-network-runtime-type-h.md) 36 37## 汇总 38 39### 成员变量 40 41| 名称 | 描述 | 42| -- | -- | 43| uint32_t quantCount | 指定numBits、scale和zeroPoint数组的长度。在per-layer量化的场景下,quantCount通常指定为1,即一个张量所有通道共享一套量化参数;在per-channel量化场景下,quantCount通常和张量通道数一致,每个通道使用自己的量化参数。 | 44| const uint32_t *numBits | 量化位数。 | 45| const double *scale | 指向量化公式中scale数据的指针。 | 46| const int32_t *zeroPoint | 指向量化公式中zero point数据的指针。 | 47 48 49