• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1# OH_NN_QuantParam
2<!--Kit: Neural Network Runtime Kit-->
3<!--Subsystem: AI-->
4<!--Owner: @GbuzhidaoR-->
5<!--Designer: @GbuzhidaoR-->
6<!--Tester: @GbuzhidaoR-->
7<!--Adviser: @ge-yafang-->
8
9## 概述
10
11量化信息。
12
13在量化的场景中,32位浮点型数据根据以下公式量化为定点数据:
14
15![zh-cn_formulaimage_0000001405137102](figures/zh-cn_formulaimage_0000001405137102.png)
16
17其中s和z是量化参数,在OH_NN_QuanParam中通过scale和zeroPoint保存,r是浮点数,q是量化后的结果,q_min是量化后下界,q_max是量化后的上界,计算方式如下:
18
19![zh-cn_formulaimage_0000001459019845](figures/zh-cn_formulaimage_0000001459019845.png)
20
21![zh-cn_formulaimage_0000001408820090](figures/zh-cn_formulaimage_0000001408820090.png)
22
23clamp函数定义如下:
24
25![zh-cn_formulaimage_0000001455538697](figures/zh-cn_formulaimage_0000001455538697.png)
26
27**起始版本:** 9
28
29**废弃版本:** 11
30
31**替代接口:** [NN_QuantParam](capi-neuralnetworkruntime-nn-quantparam.md)
32
33**相关模块:** [NeuralNetworkRuntime](capi-neuralnetworkruntime.md)
34
35**所在头文件:** [neural_network_runtime_type.h](capi-neural-network-runtime-type-h.md)
36
37## 汇总
38
39### 成员变量
40
41| 名称 | 描述 |
42| -- | -- |
43| uint32_t quantCount | 指定numBits、scale和zeroPoint数组的长度。在per-layer量化的场景下,quantCount通常指定为1,即一个张量所有通道共享一套量化参数;在per-channel量化场景下,quantCount通常和张量通道数一致,每个通道使用自己的量化参数。 |
44| const uint32_t *numBits | 量化位数。 |
45| const double *scale | 指向量化公式中scale数据的指针。 |
46| const int32_t *zeroPoint | 指向量化公式中zero point数据的指针。 |
47
48
49