# NeuralNeworkRuntime 提供Neural Network Runtime加速模型推理的相关接口。 @Syscap SystemCapability.Ai.NeuralNetworkRuntime **起始版本:** 9 ## 汇总 ### 文件 | 文件名称 | 描述 | | -------- | -------- | | [neural_network_runtime.h](neural__network__runtime_8h.md) | Neural Network Runtime部件接口定义,AI推理框架通过Neural Network Runtime提供的Native接口,完成模型构造与编译,并在加速硬件上执行推理计算。
引用文件:\ | | [neural_network_runtime_type.h](neural__network__runtime__type_8h.md) | Neural Network Runtime定义的结构体和枚举值。
引用文件:\ | ### 结构体 | 结构体名称 | 描述 | | -------- | -------- | | [OH_NN_UInt32Array](_o_h___n_n___u_int32_array.md) | 自定义的32位无符号整型数组。 | | [OH_NN_QuantParam](_o_h___n_n___quant_param.md) | 量化信息。 | | [OH_NN_Tensor](_o_h___n_n___tensor.md) | 张量结构体。 | | [OH_NN_Memory](_o_h___n_n___memory.md) | 内存结构体。 | ### 类型定义 | 类型定义名称 | 描述 | | -------- | -------- | | [OH_NNModel](#oh_nnmodel) | Neural Network Runtime的模型句柄。 | | [OH_NNCompilation](#oh_nncompilation) | Neural Network Runtime的编译器句柄。 | | [OH_NNExecutor](#oh_nnexecutor) | Neural Network Runtime的执行器句柄。 | | [OH_NN_UInt32Array](#oh_nn_uint32array) | 自定义的32位无符号整型数组类型。 | | [OH_NN_QuantParam](#oh_nn_quantparam) | 量化信息。 | | [OH_NN_Tensor](#oh_nn_tensor) | 张量结构体。 | | [OH_NN_Memory](#oh_nn_memory) | 内存结构体。 | ### 枚举 | 枚举名称 | 描述 | | -------- | -------- | | [OH_NN_PerformanceMode](#oh_nn_performancemode) { OH_NN_PERFORMANCE_NONE = 0, OH_NN_PERFORMANCE_LOW = 1, OH_NN_PERFORMANCE_MEDIUM = 2, OH_NN_PERFORMANCE_HIGH = 3, OH_NN_PERFORMANCE_EXTREME = 4 } | 硬件的性能模式。 | | [OH_NN_Priority](#oh_nn_priority) { OH_NN_PRIORITY_NONE = 0, OH_NN_PRIORITY_LOW = 1, OH_NN_PRIORITY_MEDIUM = 2, OH_NN_PRIORITY_HIGH = 3 } | 模型推理任务优先级。 | | [OH_NN_ReturnCode](#oh_nn_returncode) { OH_NN_SUCCESS = 0, OH_NN_FAILED = 1, OH_NN_INVALID_PARAMETER = 2, OH_NN_MEMORY_ERROR = 3, OH_NN_OPERATION_FORBIDDEN = 4, OH_NN_NULL_PTR = 5, OH_NN_INVALID_FILE = 6, OH_NN_UNAVALIDABLE_DEVICE = 7, OH_NN_INVALID_PATH = 8 } | Neural Network Runtime 定义的错误码类型。 | | [OH_NN_FuseType](#oh_nn_fusetype) : int8_t { OH_NN_FUSED_NONE = 0, OH_NN_FUSED_RELU = 1, OH_NN_FUSED_RELU6 = 2 } | Neural Network Runtime 融合算子中激活函数的类型。 | | [OH_NN_Format](#oh_nn_format) { OH_NN_FORMAT_NONE = 0, OH_NN_FORMAT_NCHW = 1, OH_NN_FORMAT_NHWC = 2 } | 张量数据的排布类型。 | | [OH_NN_DeviceType](#oh_nn_devicetype) { OH_NN_OTHERS = 0, OH_NN_CPU = 1, OH_NN_GPU = 2, OH_NN_ACCELERATOR = 3 } | Neural Network Runtime 支持的设备类型。 | | [OH_NN_DataType](#oh_nn_datatype) { OH_NN_UNKNOWN = 0, OH_NN_BOOL = 1, OH_NN_INT8 = 2, OH_NN_INT16 = 3, OH_NN_INT32 = 4, OH_NN_INT64 = 5, OH_NN_UINT8 = 6, OH_NN_UINT16 = 7, OH_NN_UINT32 = 8, OH_NN_UINT64 = 9, OH_NN_FLOAT16 = 10, OH_NN_FLOAT32 = 11, OH_NN_FLOAT64 = 12 } | Neural Network Runtime 支持的数据类型。 | | [OH_NN_OperationType](#oh_nn_operationtype) { OH_NN_OPS_ADD = 1, OH_NN_OPS_AVG_POOL = 2, OH_NN_OPS_BATCH_NORM = 3, OH_NN_OPS_BATCH_TO_SPACE_ND = 4, OH_NN_OPS_BIAS_ADD = 5, OH_NN_OPS_CAST = 6, OH_NN_OPS_CONCAT = 7, OH_NN_OPS_CONV2D = 8, OH_NN_OPS_CONV2D_TRANSPOSE = 9, OH_NN_OPS_DEPTHWISE_CONV2D_NATIVE = 10, OH_NN_OPS_DIV = 11, OH_NN_OPS_ELTWISE = 12, OH_NN_OPS_EXPAND_DIMS = 13, OH_NN_OPS_FILL = 14, OH_NN_OPS_FULL_CONNECTION = 15, OH_NN_OPS_GATHER = 16, OH_NN_OPS_HSWISH = 17, OH_NN_OPS_LESS_EQUAL = 18, OH_NN_OPS_MATMUL = 19, OH_NN_OPS_MAXIMUM = 20, OH_NN_OPS_MAX_POOL = 21, OH_NN_OPS_MUL = 22, OH_NN_OPS_ONE_HOT = 23, OH_NN_OPS_PAD = 24, OH_NN_OPS_POW = 25, OH_NN_OPS_SCALE = 26, OH_NN_OPS_SHAPE = 27, OH_NN_OPS_SIGMOID = 28, OH_NN_OPS_SLICE = 29, OH_NN_OPS_SOFTMAX = 30, OH_NN_OPS_SPACE_TO_BATCH_ND = 31, OH_NN_OPS_SPLIT = 32, OH_NN_OPS_SQRT = 33, OH_NN_OPS_SQUARED_DIFFERENCE = 34, OH_NN_OPS_SQUEEZE = 35, OH_NN_OPS_STACK = 36, OH_NN_OPS_STRIDED_SLICE = 37, OH_NN_OPS_SUB = 38, OH_NN_OPS_TANH = 39, OH_NN_OPS_TILE = 40, OH_NN_OPS_TRANSPOSE = 41, OH_NN_OPS_REDUCE_MEAN = 42, OH_NN_OPS_RESIZE_BILINEAR = 43, OH_NN_OPS_RSQRT = 44, OH_NN_OPS_RESHAPE = 45, OH_NN_OPS_PRELU = 46, OH_NN_OPS_RELU = 47, OH_NN_OPS_RELU6 = 48, OH_NN_OPS_LAYER_NORM = 49, OH_NN_OPS_REDUCE_PROD = 50, OH_NN_OPS_REDUCE_ALL = 51, OH_NN_OPS_QUANT_DTYPE_CAST = 52, OH_NN_OPS_TOP_K = 53, OH_NN_OPS_ARG_MAX = 54, OH_NN_OPS_UNSQUEEZE = 55, OH_NN_OPS_GELU = 56 } | Neural Network Runtime 支持算子的类型。 | | [OH_NN_TensorType](#oh_nn_tensortype) { OH_NN_TENSOR = 0, OH_NN_ADD_ACTIVATIONTYPE = 1, OH_NN_AVG_POOL_KERNEL_SIZE = 2, OH_NN_AVG_POOL_STRIDE = 3, OH_NN_AVG_POOL_PAD_MODE = 4, OH_NN_AVG_POOL_PAD = 5, OH_NN_AVG_POOL_ACTIVATION_TYPE = 6, OH_NN_BATCH_NORM_EPSILON = 7, OH_NN_BATCH_TO_SPACE_ND_BLOCKSIZE = 8, OH_NN_BATCH_TO_SPACE_ND_CROPS = 9, OH_NN_CONCAT_AXIS = 10, OH_NN_CONV2D_STRIDES = 11, OH_NN_CONV2D_PAD = 12,OH_NN_CONV2D_DILATION = 13, OH_NN_CONV2D_PAD_MODE = 14, OH_NN_CONV2D_ACTIVATION_TYPE = 15, OH_NN_CONV2D_GROUP = 16, OH_NN_CONV2D_TRANSPOSE_STRIDES = 17, OH_NN_CONV2D_TRANSPOSE_PAD = 18, OH_NN_CONV2D_TRANSPOSE_DILATION = 19, OH_NN_CONV2D_TRANSPOSE_OUTPUT_PADDINGS = 20, OH_NN_CONV2D_TRANSPOSE_PAD_MODE = 21, OH_NN_CONV2D_TRANSPOSE_ACTIVATION_TYPE = 22, OH_NN_CONV2D_TRANSPOSE_GROUP = 23, OH_NN_DEPTHWISE_CONV2D_NATIVE_STRIDES = 24, OH_NN_DEPTHWISE_CONV2D_NATIVE_PAD = 25, OH_NN_DEPTHWISE_CONV2D_NATIVE_DILATION = 26, OH_NN_DEPTHWISE_CONV2D_NATIVE_PAD_MODE = 27, OH_NN_DEPTHWISE_CONV2D_NATIVE_ACTIVATION_TYPE = 28, OH_NN_DIV_ACTIVATIONTYPE = 29, OH_NN_ELTWISE_MODE = 30, OH_NN_FULL_CONNECTION_AXIS = 31, OH_NN_FULL_CONNECTION_ACTIVATIONTYPE = 32, OH_NN_MATMUL_TRANSPOSE_A = 33, OH_NN_MATMUL_TRANSPOSE_B = 34, OH_NN_MATMUL_ACTIVATION_TYPE = 35, OH_NN_MAX_POOL_KERNEL_SIZE = 36, OH_NN_MAX_POOL_STRIDE = 37, OH_NN_MAX_POOL_PAD_MODE = 38, OH_NN_MAX_POOL_PAD = 39, OH_NN_MAX_POOL_ACTIVATION_TYPE = 40, OH_NN_MUL_ACTIVATION_TYPE = 41, OH_NN_ONE_HOT_AXIS = 42, OH_NN_PAD_CONSTANT_VALUE = 43, OH_NN_SCALE_ACTIVATIONTYPE = 44, OH_NN_SCALE_AXIS = 45, OH_NN_SOFTMAX_AXIS = 46, OH_NN_SPACE_TO_BATCH_ND_BLOCK_SHAPE = 47, OH_NN_SPACE_TO_BATCH_ND_PADDINGS = 48, OH_NN_SPLIT_AXIS = 49, OH_NN_SPLIT_OUTPUT_NUM = 50, OH_NN_SPLIT_SIZE_SPLITS = 51, OH_NN_SQUEEZE_AXIS = 52, OH_NN_STACK_AXIS = 53, OH_NN_STRIDED_SLICE_BEGIN_MASK = 54, OH_NN_STRIDED_SLICE_END_MASK = 55, OH_NN_STRIDED_SLICE_ELLIPSIS_MASK = 56, OH_NN_STRIDED_SLICE_NEW_AXIS_MASK = 57, OH_NN_STRIDED_SLICE_SHRINK_AXIS_MASK = 58, OH_NN_SUB_ACTIVATIONTYPE = 59, OH_NN_REDUCE_MEAN_KEEP_DIMS = 60, OH_NN_RESIZE_BILINEAR_NEW_HEIGHT = 61, OH_NN_RESIZE_BILINEAR_NEW_WIDTH = 62, OH_NN_RESIZE_BILINEAR_PRESERVE_ASPECT_RATIO = 63, OH_NN_RESIZE_BILINEAR_COORDINATE_TRANSFORM_MODE = 64, OH_NN_RESIZE_BILINEAR_EXCLUDE_OUTSIDE = 65, OH_NN_LAYER_NORM_BEGIN_NORM_AXIS = 66, OH_NN_LAYER_NORM_EPSILON = 67, OH_NN_LAYER_NORM_BEGIN_PARAM_AXIS = 68, OH_NN_LAYER_NORM_ELEMENTWISE_AFFINE = 69, OH_NN_REDUCE_PROD_KEEP_DIMS = 70, OH_NN_REDUCE_ALL_KEEP_DIMS = 71, OH_NN_QUANT_DTYPE_CAST_SRC_T = 72, OH_NN_QUANT_DTYPE_CAST_DST_T = 73, OH_NN_TOP_K_SORTED = 74, OH_NN_ARG_MAX_AXIS = 75, OH_NN_ARG_MAX_KEEPDIMS = 76, OH_NN_UNSQUEEZE_AXIS = 77 } | 张量的类型。 | ### 函数 | 函数 名称 | 描述 | | -------- | -------- | | [OH_NNModel_Construct](#oh_nnmodel_construct) (void) | 创建[OH_NNModel](#oh_nnmodel)类型的模型实例,搭配OH_NNModel模块提供的其他接口,完成模型实例的构造。 | | [OH_NNModel_AddTensor](#oh_nnmodel_addtensor) (OH_NNModel \*model, const OH_NN_Tensor \*tensor) | 向模型实例中添加张量。 | | [OH_NNModel_SetTensorData](#oh_nnmodel_settensordata) (OH_NNModel \*model, uint32_t index, const void \*dataBuffer, size_t length) | 设置张量的数值。 | | [OH_NNModel_AddOperation](#oh_nnmodel_addoperation) (OH_NNModel \*model, OH_NN_OperationType op, const OH_NN_UInt32Array \*paramIndices, const OH_NN_UInt32Array \*inputIndices, const OH_NN_UInt32Array \*outputIndices) | 向模型实例中添加算子。 | | [OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs) (OH_NNModel \*model, const OH_NN_UInt32Array \*inputIndices, const OH_NN_UInt32Array \*outputIndices) | 指定模型的输入输出。 | | [OH_NNModel_Finish](#oh_nnmodel_finish) (OH_NNModel \*model) | 完成模型构图。 | | [OH_NNModel_Destroy](#oh_nnmodel_destroy) (OH_NNModel \*\*model) | 释放模型实例。 | | [OH_NNModel_GetAvailableOperations](#oh_nnmodel_getavailableoperations) (OH_NNModel \*model, size_t deviceID, const bool \*\*isSupported, uint32_t \*opCount) | 查询硬件对模型内所有算子的支持情况,通过布尔值序列指示支持情况。 | | [OH_NNCompilation_Construct](#oh_nncompilation_construct) (const OH_NNModel \*model) | 创建[OH_NNCompilation](#oh_nncompilation)类型的编译实例。 | | [OH_NNCompilation_SetDevice](#oh_nncompilation_setdevice) (OH_NNCompilation \*compilation, size_t deviceID) | 指定模型编译和计算的硬件。 | | [OH_NNCompilation_SetCache](#oh_nncompilation_setcache) (OH_NNCompilation \*compilation, const char \*cachePath, uint32_t version) | 设置编译后的模型缓存路径和缓存版本。 | | [OH_NNCompilation_SetPerformanceMode](#oh_nncompilation_setperformancemode) (OH_NNCompilation \*compilation, OH_NN_PerformanceMode performanceMode) | 设置硬件的性能模式。 | | [OH_NNCompilation_SetPriority](#oh_nncompilation_setpriority) (OH_NNCompilation \*compilation, OH_NN_Priority priority) | 设置模型计算的优先级。 | | [OH_NNCompilation_EnableFloat16](#oh_nncompilation_enablefloat16) (OH_NNCompilation \*compilation, bool enableFloat16) | 是否以float16的浮点数精度计算。 | | [OH_NNCompilation_Build](#oh_nncompilation_build) (OH_NNCompilation \*compilation) | 进行模型编译。 | | [OH_NNCompilation_Destroy](#oh_nncompilation_destroy) (OH_NNCompilation \*\*compilation) | 释放Compilation对象。 | | [OH_NNExecutor_Construct](#oh_nnexecutor_construct) (OH_NNCompilation \*compilation) | 创建[OH_NNExecutor](#oh_nnexecutor)类型的执行器实例。 | | [OH_NNExecutor_SetInput](#oh_nnexecutor_setinput) (OH_NNExecutor \*executor, uint32_t inputIndex, const OH_NN_Tensor \*tensor, const void \*dataBuffer, size_t length) | 设置模型单个输入的数据。 | | [OH_NNExecutor_SetOutput](#oh_nnexecutor_setoutput) (OH_NNExecutor \*executor, uint32_t outputIndex, void \*dataBuffer, size_t length) | 设置模型单个输出的缓冲区。 | | [OH_NNExecutor_GetOutputShape](#oh_nnexecutor_getoutputshape) (OH_NNExecutor \*executor, uint32_t outputIndex, int32_t \*\*shape, uint32_t \*shapeLength) | 获取输出张量的维度信息。 | | [OH_NNExecutor_Run](#oh_nnexecutor_run) (OH_NNExecutor \*executor) | 执行推理。 | | [OH_NNExecutor_AllocateInputMemory](#oh_nnexecutor_allocateinputmemory) (OH_NNExecutor \*executor, uint32_t inputIndex, size_t length) | 在硬件上为单个输入申请共享内存。 | | [OH_NNExecutor_AllocateOutputMemory](#oh_nnexecutor_allocateoutputmemory) (OH_NNExecutor \*executor, uint32_t outputIndex, size_t length) | 在硬件上为单个输出申请共享内存。 | | [OH_NNExecutor_DestroyInputMemory](#oh_nnexecutor_destroyinputmemory) (OH_NNExecutor \*executor, uint32_t inputIndex, OH_NN_Memory \*\*memory) | 释放[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的输入内存。 | | [OH_NNExecutor_DestroyOutputMemory](#oh_nnexecutor_destroyoutputmemory) (OH_NNExecutor \*executor, uint32_t outputIndex, OH_NN_Memory \*\*memory) | 释放[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的输出内存。 | | [OH_NNExecutor_SetInputWithMemory](#oh_nnexecutor_setinputwithmemory) (OH_NNExecutor \*executor, uint32_t inputIndex, const OH_NN_Tensor \*tensor, const OH_NN_Memory \*memory) | 将[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的硬件共享内存,指定为单个输入使用的共享内存。 | | [OH_NNExecutor_SetOutputWithMemory](#oh_nnexecutor_setoutputwithmemory) (OH_NNExecutor \*executor, uint32_t outputIndex, const OH_NN_Memory \*memory) | 将[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的硬件共享内存,指定为单个输出使用的共享内存。 | | [OH_NNExecutor_Destroy](#oh_nnexecutor_destroy) (OH_NNExecutor \*\*executor) | 销毁执行器实例,释放执行器占用的内存。 | | [OH_NNDevice_GetAllDevicesID](#oh_nndevice_getalldevicesid) (const size_t \*\*allDevicesID, uint32_t \*deviceCount) | 获取对接到 Neural Network Runtime 的硬件ID。 | | [OH_NNDevice_GetName](#oh_nndevice_getname) (size_t deviceID, const char \*\*name) | 获取指定硬件的类型信息。 | | [OH_NNDevice_GetType](#oh_nndevice_gettype) (size_t deviceID, OH_NN_DeviceType \*deviceType) | 获取指定硬件的类别信息。 | ## **类型定义说明** ### OH_NN_Memory ``` typedef struct OH_NN_Memory OH_NN_Memory ``` **描述:** 内存结构体。 ### OH_NN_QuantParam ``` typedef struct OH_NN_QuantParam OH_NN_QuantParam ``` **描述:** 量化信息。 在量化的场景中,32位浮点型数据根据以下公式量化为定点数据: ![zh-cn_formulaimage_0000001460519245](figures/zh-cn_formulaimage_0000001460519245.png) 其中s和z是量化参数,在OH_NN_QuanParam中通过scale和zeroPoint保存,r是浮点数,q是量化后的结果,q_min是量化后下界,q_max是量化后的上界,计算方式如下: ![zh-cn_formulaimage_0000001460759081](figures/zh-cn_formulaimage_0000001460759081.png) ![zh-cn_formulaimage_0000001460639441](figures/zh-cn_formulaimage_0000001460639441.png) clamp函数定义如下: ![zh-cn_formulaimage_0000001410679330](figures/zh-cn_formulaimage_0000001410679330.png) ### OH_NN_Tensor ``` typedef struct OH_NN_Tensor OH_NN_Tensor ``` **描述:** 张量结构体。 通常用于构造模型图中的数据节点和算子参数,在构造张量时需要明确数据类型、维数、维度信息和量化信息。 ### OH_NN_UInt32Array ``` typedef struct OH_NN_UInt32Array OH_NN_UInt32Array ``` **描述:** 自定义的32位无符号整型数组类型。 ### OH_NNCompilation ``` typedef struct OH_NNCompilation OH_NNCompilation ``` **描述:** Neural Network Runtime的编译器句柄。 ### OH_NNExecutor ``` typedef struct OH_NNExecutor OH_NNExecutor ``` **描述:** Neural Network Runtime的执行器句柄。 ### OH_NNModel ``` typedef struct OH_NNModel OH_NNModel ``` **描述:** Neural Network Runtime的模型句柄。 ## **枚举类型说明** ### OH_NN_DataType ``` enum OH_NN_DataType ``` **描述:** Neural Network Runtime支持的数据类型。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_UNKNOWN | 张量数据类型未知。 | | OH_NN_BOOL | 张量数据类型为bool。 | | OH_NN_INT8 | 张量数据类型为int8。 | | OH_NN_INT16 | 张量数据类型为int16。 | | OH_NN_INT32 | 张量数据类型为int32。 | | OH_NN_INT64 | 张量数据类型为int64。 | | OH_NN_UINT8 | 张量数据类型为uint8。 | | OH_NN_UINT16 | 张量数据类型为uint16。 | | OH_NN_UINT32 | 张量数据类型为uint32。 | | OH_NN_UINT64 | 张量数据类型为uint64。 | | OH_NN_FLOAT16 | 张量数据类型为float16。 | | OH_NN_FLOAT32 | 张量数据类型为float32。 | | OH_NN_FLOAT64 | 张量数据类型为float64。 | ### OH_NN_DeviceType ``` enum OH_NN_DeviceType ``` **描述:** Neural Network Runtime支持的设备类型。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_OTHERS | 不属于CPU、GPU、专用加速器的设备。 | | OH_NN_CPU | CPU设备。 | | OH_NN_GPU | GPU设备。 | | OH_NN_ACCELERATOR | 专用硬件加速器。 | ### OH_NN_Format ``` enum OH_NN_Format ``` **描述:** 张量数据的排布类型。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_FORMAT_NONE | 当张量没有特定的排布类型(如标量或矢量)时,使用本枚举值。 | | OH_NN_FORMAT_NCHW | 当张量按照NCHW的格式排布数据时,使用本枚举值。 | | OH_NN_FORMAT_NHWC | 当张量按照NHWC的格式排布数据时,使用本枚举值。 | ### OH_NN_FuseType ``` enum OH_NN_FuseType : int8_t ``` **描述:** Neural Network Runtime融合算子中激活函数的类型。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_FUSED_NONE | 未指定融合激活函数。 | | OH_NN_FUSED_RELU | 融合relu激活函数。 | | OH_NN_FUSED_RELU6 | 融合relu6激活函数。 | ### OH_NN_OperationType ``` enum OH_NN_OperationType ``` **描述:** Neural Network Runtime支持算子的类型。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_OPS_ADD | 返回两个输入张量对应元素相加的和的张量。
输入:
- input1,第一个输入的张量,数据类型要求为布尔值或者数字。
- input2,第二个输入的张量,数据类型和形状需要和第一个输入保持一致。
参数:
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,input1和input2的和,数据形状与输入broadcast之后一样,数据类型与较高精度的输入精度一致 | | OH_NN_OPS_AVG_POOL | 在输入张量上应用2D平均池化,仅支持NHWC格式的张量。支持int8量化输入。
如果输入中含有padMode参数:
输入:
- input,一个张量。
参数:
- kernelSize,用来取平均值的kernel大小,是一个长度为2的int数组[kernel_height,kernel_weight], 第一个数表示kernel高度,第二个数表示kernel宽度。
- strides,kernel移动的距离,是一个长度为2的int数组[stride_height,stride_weight], 第一个数表示高度上的移动步幅,第二个数表示宽度上的移动步幅。
- padMode,填充模式,int类型的可选值,0表示same,1表示valid,并且以最近邻的值填充。 same,输出的高度和宽度与input相同,填充总数将在水平和垂直方向计算,并在可能的情况下均匀分布到顶部 和底部、左侧和右侧。否则,最后一个额外的填充将从底部和右侧完成。 valid,输出的可能最大高度和宽度将在不填充的情况下返回。额外的像素将被丢弃。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
如果输入中含有padList参数:
输入:
- input,一个张量。
参数:
- kernelSize,用来取平均值的kernel大小,是一个长度为2的int数组[kernel_height,kernel_weight], 第一个数表示kernel高度,第二个数表示kernel宽度。
- strides,kernel移动的距离,是一个长度为2的int数组[stride_height,stride_weight], 第一个数表示高度上的移动步幅,第二个数表示宽度上的移动步幅。
- padList,input周围的填充,是一个长度为4的int数组[top,bottom,left,right],并且以最近邻的值填充。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,对input进行平均池化后的结果。 | | OH_NN_OPS_BATCH_NORM | 对一个张量进行batch normalization,对张量元素进行缩放和位移,缓解一批数据中潜在的covariate shift。
输入:
- input,一个n维的张量,要求形状为[N,...,C],即第n维是通道数(channel)。
- scale,缩放因子的1D张量,用于缩放归一化的第一个张量。
- offset,用于偏移的1D张量,以移动到归一化的第一个张量。
- mean,总体均值的一维张量,仅用于推理;对于训练,必须为空。
- variance,用于总体方差的一维张量。仅用于推理;对于训练,必须为空。
参数:
- epsilon,数值稳定性的小附加值。
输出:
- output,n维输出张量,形状和数据类型与input一致。 | | OH_NN_OPS_BATCH_TO_SPACE_ND | 将一个四维张量的batch维度按block_shape切分成小块,并将这些小块拼接到空间维度。
参数:
- input,输入张量,维将被切分,拼接回空间维度。
输出:
- blockSize,一个长度为2的数组[height_block,weight_block],指定切分到空间维度上的block大小。
- crops,一个shape为(2,2)的二维数组[[crop0_start,crop0_end],[crop1_start,crop1_end]], 表示在output的空间维度上截掉部分元素。
输出:
- output,假设input的形状为(n,h,w,c),output的形状为(n',h',w',c'): n' = n / (block_shape[0] \* block_shape[1]) h' = h \* block_shape[0] - crops[0][0] - crops[0][1] w' = w \* block_shape[1] - crops[1][0] - crops[1][1] c'= c | | OH_NN_OPS_BIAS_ADD | 对给出的输入张量上的各个维度方向上的数据进行偏置。
输入:
- input,输入张量,可为2-5维度。
- bias,参数对应输入维度数量的偏移值。
输出:
- output,根据input中每个维度方向偏移后的结果。 | | OH_NN_OPS_CAST | 对输入张量中的数据类型进行转换。
输入:
- input,输入张量。
- type,转换后的数据类型。
输出:
- output,转换后的张量。 | | OH_NN_OPS_CONCAT | 在指定维度上连接张量。
输入:
- input:N个输入张量。
参数:
- axis,指定张量连接的维度。
输出:
- output,输出N个张量沿axis连接的结果。 | | OH_NN_OPS_CONV2D | 二维卷积层。
如果输入中含有padMode参数:
输入:
- input,输入张量。
- weight,卷积的权重,要求weight排布为[outChannel,kernelHeight,kernelWidth,inChannel/group], inChannel必须要能整除group。
- bias,卷积的偏置,是长度为[outChannel]的数组。在量化场景下,bias 参数不需要量化参数,其量化 版本要求输入 OH_NN_INT32 类型数据,实际量化参数由 input 和 weight 共同决定。
参数:
- stride,卷积核在height和weight上的步幅,是一个长度为2的int数组[strideHeight,strideWidth]。
- dilation,表示扩张卷积在height和weight上的扩张率,是一个长度为2的int数组[dilationHeight,dilationWidth], 值必须大于或等于1,并且不能超过input的height和width。
- padMode,input的填充模式,支持same和valid,int类型,0表示same,1表示valid。 same,输出的高度和宽度与input相同,填充总数将在水平和垂直方向计算,并在可能的情况下均匀分布到顶部和底部、左侧 和右侧。否则,最后一个额外的填充将从底部和右侧完成。 Valid,输出的可能最大高度和宽度将在不填充的情况下返回。额外的像素将被丢弃。
- group,将input按in_channel分组,int类型。group等于1,这是常规卷积;group大于1且小于或等于in_channel,这是分组卷积。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
如果输入中含有padList参数:
输入:
- input,输入张量。
- weight,卷积的权重,要求weight排布为[outChannel,kernelHeight,kernelWidth,inChannel/group], inChannel必须要能整除group。
- bias,卷积的偏置,是长度为[outChannel]的数组。在量化场景下,bias 参数不需要量化参数,其量化 版本要求输入 OH_NN_INT32 类型数据,实际量化参数由 input 和 weight 共同决定。
参数:
- stride,卷积核在height和weight上的步幅,是一个长度为2的int数组[strideHeight,strideWidth]。
- dilation,表示扩张卷积在height和weight上的扩张率,是一个长度为2的int数组[dilationHeight,dilationWidth]。 值必须大于或等于1,并且不能超过input的height和width。
- padList,input周围的填充,是一个长度为4的int数组[top,bottom,left,right]。
- group,将input按in_channel分组,int类型。 group等于1,这是常规卷积。 group等于in_channel,这是depthwiseConv2d,此时group==in_channel==out_channel。 group大于1且小于in_channel,这是分组卷积,out_channel==group。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,卷积计算结果。 | | OH_NN_OPS_CONV2D_TRANSPOSE | 二维卷积转置。
如果输入中含有padMode参数:
输入:
- input,输入张量。
- weight,卷积的权重,要求weight排布为[outChannel,kernelHeight,kernelWidth,inChannel/group], inChannel必须要能整除group。
- bias,卷积的偏置,是长度为[outChannel]的数组。在量化场景下,bias参数不需要量化参数,其量化 版本要求输入OH_NN_INT32类型数据,实际量化参数由input和weight共同决定。
- stride,卷积核在height和weight上的步幅,是一个长度为2的int数组[strideHeight,strideWidth]。
参数:
- dilation,表示扩张卷积在height和weight上的扩张率,是一个长度为2的int数组[dilationHeight,dilationWidth]。 值必须大于或等于1,并且不能超过input的height和width。
- padMode,input的填充模式,支持same和valid,int类型,0表示same,1表示valid。 same,输出的高度和宽度与input相同,填充总数将在水平和垂直方向计算,并在可能的情况下均匀分布到顶部和底部、左侧 和右侧。否则,最后一个额外的填充将从底部和右侧完成。 Valid,输出的可能最大高度和宽度将在不填充的情况下返回。额外的像素将被丢弃。
- group,将input按in_channel分组,int类型。group等于1,这是常规卷积;group大于1且小于或等于in_channel,这是分组卷积。
- outputPads,一个整数或元组/2 个整数的列表,指定沿输出张量的高度和宽度的填充量。可以是单个整数,用于为所 有空间维度指定相同的值。沿给定维度的输出填充量必须小于沿同一维度的步幅。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
如果输入中含有padList参数:
输入:
- input,输入张量。
- weight,卷积的权重,要求weight排布为[outChannel,kernelHeight,kernelWidth,inChannel/group], inChannel必须要能整除group。
- bias,卷积的偏置,是长度为[outChannel]的数组。在量化场景下,bias 参数不需要量化参数,其量化 版本要求输入 OH_NN_INT32 类型数据,实际量化参数由 input 和 weight 共同决定。
参数:
- stride,卷积核在height和weight上的步幅,是一个长度为2的int数组[strideHeight,strideWidth]。
- dilation,表示扩张卷积在height和weight上的扩张率,是一个长度为2的int数组[dilationHeight,dilationWidth]。 值必须大于或等于1,并且不能超过input的height和width。
- padList,input周围的填充,是一个长度为4的int数组[top,bottom,left,right]。
- group,将input按in_channel分组,int类型。group等于1,这是常规卷积;group大于1且小于或等于in_channel,这是分组卷积。
- outputPads,一个整数或元组/2 个整数的列表,指定沿输出张量的高度和宽度的填充量。可以是单个整数,用于为所 有空间维度指定相同的值。沿给定维度的输出填充量必须小于沿同一维度的步幅。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,卷积转置后的计算结果。 | | OH_NN_OPS_DEPTHWISE_CONV2D_NATIVE | 二维深度可分离卷积。
如果输入中含有padMode参数:
输入:
- input,输入张量。
- weight,卷积的权重,要求weight排布为[outChannel,kernelHeight,kernelWidth,1],outChannel = channelMultiplier \* inChannel。
- bias,卷积的偏置,是长度为[outChannel]的数组。在量化场景下,bias 参数不需要量化参数,其量化 版本要求输入 OH_NN_INT32 类型数据,实际量化参数由 input 和 weight 共同决定。
参数:
- stride,卷积核在height和weight上的步幅,是一个长度为2的int数组[strideHeight,strideWidth]。
- dilation,表示扩张卷积在height和weight上的扩张率,是一个长度为2的int数组[dilationHeight,dilationWidth]。 值必须大于或等于1,并且不能超过input的height和width。
- padMode,input的填充模式,支持same和valid,int类型,0表示same,1表示valid same,输出的高度和宽度与input相同,填充总数将在水平和垂直方向计算,并在可能的情况下均匀分布到顶部和底部、左侧 和右侧。否则,最后一个额外的填充将从底部和右侧完成 Valid,输出的可能最大高度和宽度将在不填充的情况下返回。额外的像素将被丢弃
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
如果输入中含有padList 参数:
输入:
- input,输入张量。
- weight,卷积的权重,要求weight排布为[outChannel,kernelHeight,kernelWidth,1],outChannel = channelMultiplier \* inChannel。
- bias,卷积的偏置,是长度为[outChannel]的数组。在量化场景下,bias参数不需要量化参数,其量化 版本要求输入 OH_NN_INT32 类型数据,实际量化参数由 input和weight共同决定。
参数:
- stride,卷积核在height和weight上的步幅,是一个长度为2的int数组[strideHeight,strideWidth]。
- dilation,表示扩张卷积在height和weight上的扩张率,是一个长度为2的int数组[dilationHeight,dilationWidth]。 值必须大于或等于1,并且不能超过input的height和width。
- padList,input周围的填充,是一个长度为4的int数组[top,bottom,left,right]。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,卷积计算的结果。 | | OH_NN_OPS_DIV | 对输入的两个标量或张量做除法。
输入:
- input1,第一个输入是标量或布尔值或数据类型为数字或布尔值的张量。
- input2,数据类型根据input1的类型,要求有所不同: 当第一个输入是张量时,第二个输入可以是实数或布尔值或数据类型为实数/布尔值的张量。 当第一个输入是实数或布尔值时,第二个输入必须是数据类型为实数/布尔值的张量。
参数:
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,input1和input2相除的结果。 | | OH_NN_OPS_ELTWISE | 设置参数对输入进行product(点乘)、sum(相加减)或max(取大值)。
输入:
- input1,第一个输入张量。
- input2,第二个输入张量。
参数:
- mode,枚举,选择操作方式。
输出:
- output,计算后的结果,output和input1拥有相同的数据类型和形状。 | | OH_NN_OPS_EXPAND_DIMS | 在给定维度上为张量添加一个额外的维度。
输入:
- input,输入张量。
- axis,需要添加的维度的index,int32_t类型,值必须在[-dim-1,dim],且只允许常量值。
输出:
- output,维度拓展后的张量。 | | OH_NN_OPS_FILL | 根据指定的形状,创建由一个标量填充的张量。
输入:
- value,填充的标量。
- shape,指定创建张量的形状。
输出:
- output,生成的张量,和value具有相同的数据类型,张量形状由shape参数指定。 | | OH_NN_OPS_FULL_CONNECTION | 全连接,整个输入作为feature map,进行特征提取。
输入:
- input,全连接的输入张量。
- weight,全连接的权重张量。
- bias,全连接的偏置,在量化场景下,bias参数不需要量化参数,其量化版本要求输入OH_NN_INT32 类型数据,实际量化参数由input和weight共同决定。
参数:
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,输出运算后的张量。
如果输入中含有axis参数:
输入:
- input,全连接的输入张量。
- weight,全连接的权重张量。
- bias,全连接的偏置,在量化场景下,bias参数不需要量化参数,其量化版本要求输入 OH_NN_INT32 类型数据,实际量化参数由input和weight共同决定。
参数:
- axis,input做全连接的轴,从指定轴axis开始,将axis和axis后面的轴展开成一维去做全连接
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,输出运算后的张量。 | | OH_NN_OPS_GATHER | 根据指定的索引和轴返回输入张量的切片。
输入:
- input,输入待切片的张量。
- inputIndices,指定input在axis上的索引,是一个int类型的数组,值必须在[0,input.shape[axis])范围内
- axis,input被切片的轴,int32_t类型的数组,数组长度为1。
输出:
- output,输出切片后的张量。 | | OH_NN_OPS_HSWISH | 计算输入的Hswish激活值。
输入:
- input,一个n维输入张量。
输出:
- output,n维Hswish激活值,数据类型和shape和input一致。 | | OH_NN_OPS_LESS_EQUAL | 对input1和input2,计算每对元素的input1[i]<=input2[i]的结果,i是输入张量中每个元素的索引。
输入:
- input1,可以是实数、布尔值或数据类型是实数/NN_BOOL的张量。
- input2,如果input1是张量,input2可以是实数、布尔值,否则只能是张量,其数据类型是实数或NN_BOOL。
输出:
- 张量,数据类型为NN_BOOL的张量,使用量化模型时,output的量化参数不可省略,但量化参数的数值不会对输入结果产生影响。 | | OH_NN_OPS_MATMUL | 计算input1和input2的内积。
输入:
- input1,n维输入张量。
- input2,n维输入张量。
参数:
- TransposeX,布尔值,是否对input1进行转置。
- TransposeY,布尔值,是否对input2进行转置。
输出:
- output,计算得到内积,当type!=NN_UNKNOWN时,output数据类型由type决定;当type==NN_UNKNOWN时, output的数据类型取决于input1和input2进行计算时转化的数据类型。 | | OH_NN_OPS_MAXIMUM | 计算input1和input2对应元素最大值,input1和input2的输入遵守隐式类型转换规则,使数据类型一致。输入必须是两个张量或一个张量和一个标量。当输入是两个张量时,它们的数据类型不能同时为NN_BOOL。它们的形状支持broadcast成相同的大小。当输入是一个张量和一个标量时,标量只能是一个常数。
输入:
- input1,n维输入张量,实数或NN_BOOL类型。
- input2,n维输入张量,实数或NN_BOOL类型。
输出:
- output,n维输出张量,output的shape和数据类型和两个输入张量中精度或者位数高的相同。 | | OH_NN_OPS_MAX_POOL | 在输入张量上应用2D最大值池化。
如果输入中含有padMode参数:
输入:
- input,一个张量。
参数:
- kernelSize,用来取最大值的kernel大小,是一个长度为2的int数组[kernel_height,kernel_weight], 第一个数表示kernel高度,第二个数表示kernel宽度。
- strides,kernel移动的距离,是一个长度为2的int数组[stride_height,stride_weight], 第一个数表示高度上的移动步幅,第二个数表示宽度上的移动步幅。
- padMode,填充模式,int类型的可选值,0表示same,1表示valid,并且以最近邻的值填充。 same,输出的高度和宽度与input相同,填充总数将在水平和垂直方向计算,并在可能的情况下均匀分布到顶部 和底部、左侧和右侧。否则,最后一个额外的填充将从底部和右侧完成。 valid,输出的可能最大高度和宽度将在不填充的情况下返回。额外的像素将被丢弃。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
如果输入中含有padList参数:
输入:
- input,一个张量。
参数:
- kernelSize,用来取最大值的kernel大小,是一个长度为2的int数组[kernel_height,kernel_weight], 第一个数表示kernel高度,第二个数表示kernel宽度。
- strides,kernel移动的距离,是一个长度为2的int数组[stride_height,stride_weight], 第一个数表示高度上的移动步幅,第二个数表示宽度上的移动步幅。
- padList,input周围的填充,是一个长度为4的int数组[top,bottom,left,right],并且以最近邻的值填充。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,对input最大值池化后的张量。 | | OH_NN_OPS_MUL | 将input1和input2相同的位置的元素相乘得到output。如果input1和input2类型shape不同,要求input1和input2可以通过broadcast扩充成相同的shape进行相乘。
输入:
- input1,一个n维张量。
- input2,一个n维张量。
参数:
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,input1和input2每个元素的乘积。 | | OH_NN_OPS_ONE_HOT | 根据indices指定的位置,生成一个由one-hot向量构成的张量。每个onehot向量中的有效值由on_value决定,其他位置由off_value决定。
输入:
- indices,n维张量。indices中每个元素决定每个one-hot向量,on_value的位置
- depth,一个整型标量,决定one-hot向量的深度。要求depth>0。
- on_value,一个标量,指定one-hot向量中的有效值。
- off_value,一个标量,指定one-hot向量中除有效位以外,其他位置的值。
参数:
- axis,一个整型标量,指定插入one-hot的维度。 indices的形状是[N,C],depth的值是D,当axis=0时,output形状为[D,N,C], indices的形状是[N,C],depth的值是D,当axis=-1时,output形状为[N,C,D], indices的形状是[N,C],depth的值是D,当axis=1时,output形状为[N,D,C]。
输出:
- output,如果indices时n维张量,则output是(n+1)维张量。output的形状由indices和axis共同决定。 | | OH_NN_OPS_PAD | 在input1指定维度的数据前后,添加指定数值进行增广。
输入:
- input,一个n维张量,要求input1的排布为[BatchSize,…]。
- paddings,一个二维张量,指定每一维度增补的长度,shape为[n,2]。paddings[i][0]表示第i维上,需要在input前增补的数量; paddings[i][1]表示第i维上,需要在inputX后增补的数量。
参数:
- padValues,一个常数,数据类型和input一致,指定Pad操作补全的数值。
输出:
- output,一个n维张量,维数和数据类型和input保持一致。shape由input和paddings共同决定 output.shape[i] = input.shape[i] + paddings[i][0]+paddings[i][1]。 | | OH_NN_OPS_POW | 求input的y次幂,输入必须是两个张量或一个张量和一个标量。当输入是两个张量时,它们的数据类型不能同时为NN_BOOL, 且要求两个张量的shape相同。当输入是一个张量和一个标量时,标量只能是一个常数。
输入:
- input,实数、bool值或张量,张量的数据类型为实数/NN_BOOL。
- y,实数、bool值或张量,张量的数据类型为实数/NN_BOOL。
输出:
- output,形状由input和y通过broadcast后的形状决定。 | | OH_NN_OPS_SCALE | 给定一个张量,计算其缩放后的值。
输入:
- input,一个n维张量。
- scale,缩放张量。
- bias,偏置张量。
参数:
- axis,指定缩放的维度。
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,scale的计算结果,一个n维张量,类型和input一致,shape由axis决定。 | | OH_NN_OPS_SHAPE | 输入一个张量,计算其shape。
输入:
- input,一个n维张量。
输出:
- output,输出张量的维度,一个整型数组。 | | OH_NN_OPS_SIGMOID | 给定一个张量,计算其sigmoid结果。
输入:
- input,一个n维张量。
输出:
- output,sigmoid的计算结果,一个n维张量,类型和shape和input一致。 | | OH_NN_OPS_SLICE | 在输入张量的各个维度,以begin为起点,截取size长度的切片。
输入:
- input,n维输入张量。
- begin,一组不小于0的整数,指定每个维度上的起始切分点。
- size,一组不小于1的整数,指定每个维度上切片的长度。假设某一维度i,1<=size[i]<=input.shape[i]-begin[i]。
输出:
- output,切片得到的n维张量,其TensorType和input一致,shape和size相同。 | | OH_NN_OPS_SOFTMAX | 给定一个张量,计算其softmax结果。
输入:
- input,n维输入张量。
参数:
- axis,int64类型,指定计算softmax的维度。整数取值范围为[-n,n)。
输出:
- output,softmax的计算结果,一个n维张量,类型和shape和input一致。 | | OH_NN_OPS_SPACE_TO_BATCH_ND | 将四维张量在空间维度上进行切分成blockShape[0] \* blockShape[1]个小块,然后在batch维度上拼接这些小块。
输入:
- input,一个四维张量
参数:
- blockShape,一对整数,每个整数不小于1。
- paddings,一对数组,每个数组由两个整数组成。组成paddings的4个整数都不小于0。paddings[0][0]和paddings[0][1]指 定了第三个维度上padding的数量,paddings[1][0]和paddings[1][1]指定了第四个维度上padding的数量。
输出:
- output,一个四维张量,数据类型和input一致。shape由input,blockShape和paddings共同决定,假设input shape为[n,c,h,w],则有 output.shape[0] = n \* blockShape[0] \* blockShape[1] output.shape[1] = c output.shape[2] = (h + paddings[0][0] + paddings[0][1]) / blockShape[0] output.shape[3] = (w + paddings[1][0] + paddings[1][1]) / blockShape[1] 要求(h + paddings[0][0] + paddings[0][1])和(w + paddings[1][0] + paddings[1][1])能被 blockShape[0]和blockShape[1]整除。 | | OH_NN_OPS_SPLIT | Split算子沿axis维度将input拆分成多个张量,张量数量由outputNum指定。
输入:
- input,n维张量。
参数:
- outputNum,long,输出张量的数量,output_num类型为int。
- size_splits,一维张量,指定张量沿axis轴拆分后,每个张量的大小,size_splits 类型为 int。 如果size_splits的数据为空,则张量被拆分成大小均等的张量,此时要求input.shape[axis]可以被outputNum整除; 如果size_splits不为空,则要求 size_splits所有元素之和等于input.shape[axis]。
- axis,指定拆分的维度,axis类型为int。
输出:
- outputs,一组n维张量,每一个张量类型和shape相同,每个张量的类型和input一致。 | | OH_NN_OPS_SQRT | 给定一个张量,计算其平方根。
输入:
- input,一个n维张量。
输出:
- output,输入的平方根,一个n维张量,类型和shape和input一致。 | | OH_NN_OPS_SQUARED_DIFFERENCE | 计算两个输入的差值并返回差值的平方。SquaredDifference算子支持张量和张量相减。 如果两个张量的TensorType不相同,Sub算子会将低精度的张量转成更高精度的类型。 如果两个张量的shape不同,要求两个张量可以通过broadcast拓展成相同shape的张量。
输入:
- input1,被减数,input1是一个张量,张量的类型可以是NN_FLOAT16、NN_FLOAT32、NN_INT32或NN_BOOL。
- input2,减数,input2是一个张量,张量的类型可以是NN_FLOAT16、NN_FLOAT32、NN_INT32或NN_BOOL。
输出:
- output,两个输入差值的平方。output的shape由input1和input2共同决定,input1和input2的shape相同时, output的shape和input1、input2相同;shape不同时,需要将input1或input2做broadcast操作后,相减得到output。 output的TensorType由两个输入中更高精度的TensorType决定。 | | OH_NN_OPS_SQUEEZE | 去除axis中,长度为1的维度。支持int8量化输入假设input的shape为[2,1,1,2,2],axis为[0,1], 则output的shape为[2,1,2,2]。第0维到第一维之间,长度为0的维度被去除。
输入:
- input,n维张量。
参数:
- axis,指定删除的维度。axis可以是一个int64_t的整数或数组,整数的取值范围为[-n,n)。
输出:
- output,输出张量。 | | OH_NN_OPS_STACK | 将一组张量沿axis维度进行堆叠,堆叠前每个张量的维数为n,则堆叠后output维数为n+1。
输入:
- input,Stack支持传入多个输入n维张量,每个张量要求shape相同且类型相同。
参数:
- axis,一个整数,指定张量堆叠的维度。axis可以是负数,axis取值范围为[-(n+1),(n+1))。
输出:
- output,将input沿axis维度堆叠的输出,n+一维张量,TensorType和input相同。 | | OH_NN_OPS_STRIDED_SLICE | 跨步截取张量。
输入:
- input,n维输入张量。
- begin,一维张量,begin的长度等于n,begin[i]指定第i维上截取的起点。
- end,一维张量,end的长度等于n,end[i]指定第i维上截取的终点。
- strides,一维张量,strides的长度等于n,strides[i]指定第i维上截取的步长。
参数:
- beginMask,一个整数,用于解除begin的限制。将beginMask转成二进制表示,如果binary(beginMask)[i]==1, 则对于第i维,从第一个元素开始,以strides[i]为步长截取元素直到第end[i]-1个元素。
- endMask,个整数,用于解除end的限制。将endMask转成二进制表示,如果binary(endMask)[i]==1,则对于第i维, 从第begin[i]个元素起,以strides[i]为步长截取元素直到张量边界。
- ellipsisMask,一个整数,用于解除begin和end的限制。将ellipsisMask转成二进制表示,如果binary(ellipsisMask)[i]==1, 则对于第i维,从第一个元素开始,以strides[i]为补偿,截取元素直到张量边界。binary(ellipsisMask)仅允许有一位不为0。
- newAxisMask,一个整数,用于新增维度。将newAxisMask转成二进制表示,如果binary(newAxisMask)[i]==1,则在第i维插入长度为1的新维度。
- shrinkAxisMask,一个整数,用于压缩指定维度。将shrinkAxisMask转成二进制表示,如果binary(shrinkAxisMask)[i]==1, 则舍去第i维所有元素,第i维长度压缩至1。
输出:
- 堆叠运算后的张量,数据类型与input相同。输出维度rank(input[0])+1 维。 | | OH_NN_OPS_SUB | 计算两个输入的差值。
输入:
- input1,一个张量,作为减法中的被减数。
- input2,一个张量,作为减法中的减数。
参数:
- activationType,是一个整型常量,且必须是FuseType中含有的值。 在输出之前调用指定的激活。
输出:
- output,两个输入相减的差。output的shape由input1和input2共同决定,当input1和input2的shape相同时,output的shape和input1、input2相同; shape不同时,需要将input1或input2做broadcast操作后,相减得到output。output的TensorType由两个输入中更高精度的TensorType决定。 | | OH_NN_OPS_TANH | 计算输入张量的双曲正切值。
输入:
- input,n维张量。
输出:
- output,input的双曲正切,TensorType和张量shape和input相同。 | | OH_NN_OPS_TILE | 以multiples指定的次数拷贝输入。
输入:
- input,n维张量。
- multiples,一维张量,指定各个维度拷贝的次数。其长度m不小于input的维数n。
输出:
- 张量,m维张量,TensorType与input相同。如果input和multiples长度相同, 则output和input维数一致,都是n维张量;如果multiples长度大于n,则用1填充input的维度, 再在各个维度上拷贝相应的次数,得到m维张量。 | | OH_NN_OPS_TRANSPOSE | 根据permutation对input进行数据重排。
输入:
- input,n维张量,待重排的张量。
- perm,一维张量,其长度和input的维数一致。
输出:
- output,n维张量,output的TensorType与input相同,shape由input的shape和permutation共同决定。 | | OH_NN_OPS_REDUCE_MEAN | keepDims为false时,计算指定维度上的平均值,减少input的维数;当keepDims为true时,计算指定维度上的平均值,保留相应的维度。
输入:
- input,n维输入张量,n<8。
- axis,一维张量,指定计算均值的维度,axis中每个元素的取值范围为[-n,n)。
参数:
- keepDims,布尔值,是否保留维度的标志位。
输出:
- output,m维输出张量,数据类型和input相同。当keepDims为false时,m==n;当keepDims为true时,m<n。 | | OH_NN_OPS_RESIZE_BILINEAR | 采用Bilinear方法,按给定的参数对input进行变形。
输入:
- input,四维输入张量,input中的每个元素不能小于0。input排布必须是[batchSize,height,width,channels]。
参数:
- newHeight,resize之后四维张量的height值。
- newWidth,resize之后四维张量的width值。
- preserveAspectRatio,一个布尔值,指示resize操作是否保持input的height/width比例。
- coordinateTransformMode,一个int32整数,指示Resize操作所使用的坐标变换方法,目前支持以下方法:
- excludeOutside,一个int64浮点数。当excludeOutside=1时,超出input边界的采样权重被置为0,其余权重重新归一化处理。
输出:
- output,n维输出张量,output的shape和数据类型和input相同。 | | OH_NN_OPS_RSQRT | 求input平方根的倒数。
输入:
- input,n维输入张量,input中的每个元素不能小于0,n<8。
输出:
- output,n维输出张量,output的shape和数据类型和input相同。 | | OH_NN_OPS_RESHAPE | 根据inputShape调整input的形状。
输入:
- input,一个n维输入张量。
- InputShape,一个一维张量,表示输出张量的shape,需要是一个常量张量。
输出:
- output,输出张量,数据类型和input一致,shape由inputShape决定。 | | OH_NN_OPS_PRELU | 计算input和weight的PReLU激活值。
输入:
- input,一个n维张量,如果n>=2,则要求input的排布为[BatchSize,…,Channels],第二个维度为通道数。
- output,input的PReLU激活值。形状和数据类型和input保持一致。 | | OH_NN_OPS_RELU | 计算input的Relu激活值。
输入:
- input,一个n维输入张量。
输出:
- output,n维Relu输出张量,数据类型和shape和input一致。 | | OH_NN_OPS_RELU6 | 计算input的Relu6激活值,即对input中每个元素x,计算min(max(x,0),6)。
输入:
- input,一个n维输入张量。
输出:
- output,n维Relu6输出张量,数据类型和shape和input一致。 | | OH_NN_OPS_LAYER_NORM | 对一个张量从某一axis开始做层归一化。
输入:
- input,一个n维输入张量。
- gamma,一个m维张量,gamma维度应该与input做归一化部分的shape一致。
- beta,一个m维张量,shape与gamma一样。
参数:
- beginAxis,是一个NN_INT32的标量,指定开始做归一化的轴,取值范围是[1,rank(input))。
- epsilon,是一个NN_FLOAT32的标量,是归一化公式中的微小量,常用值是1e-7。
输出:
- output,n维输出张量,数据类型和shape和input一致。 | | OH_NN_OPS_REDUCE_PROD | 沿着axis指定的维度,计算input的累积。
输入:
- input,n维输入张量,n<8。
- axis,一维张量,指定计算乘的维度,axis中每个元素的取值范围为[-n,n)。
参数:
- keepDims,布尔值,是否保留维度的标志位。当keepDims为true时,output的维数和input保持一致;当keepDims为false时,output的维数缩减。
输出:
- output,m维输出张量,数据类型和input相同。当keepDims为false时,m==n;当keepDims为true时,m<n。 | | OH_NN_OPS_REDUCE_ALL | 当keepDims为false时,计算指定维度上的逻辑与,减少input的维数;当keepDims为true时,计算指定维度上的逻辑与,保留相应的维度。
输入:
- input,n维输入张量,n<8。
- axis,一维张量,指定计算逻辑与的维度,axis中每个元素的取值范围为[-n,n)。
参数:
- keepDims,布尔值,是否保留维度的标志位。
输出:
- output,m维输出张量,数据类型和input相同。当keepDims为false时,m==n;当keepDims为true时,m<n。 | | OH_NN_OPS_QUANT_DTYPE_CAST | 数据类型转换。
输入:
- input,n维张量。
参数:
- src_t,定义输入的数据类型。
- dst_t,定义输出的数据类型。
输出:
- output,n维张量,数据类型由input决定,输出的形状和输入相同。 | | OH_NN_OPS_TOP_K | 查找沿最后一个维度的k个最大条目的值和索引。
输入:
- input,n维张量。
- k,指明是得到前k个数据以及其index。
参数:
- sorted,如果为True,按照大到小排序,如果为False,按照小到大排序。
输出:
- output0,最后一维的每个切片中的k个最大元素。
- output1,输入的最后一个维度内的值的索引。 | | OH_NN_OPS_ARG_MAX | 返回跨轴的张量最大值的索引。
输入:
- input,n维张量,输入张量(N,∗),其中∗意味着任意数量的附加维度。
参数:
- axis,指定求最大值索引的维度。
- keep_dims,bool值,是否维持输入张量维度。
输出:
- output,张量,轴上输入张量最大值的索引。 | | OH_NN_OPS_UNSQUEEZE | 根据输入axis的值,增加一个维度。
输入:
- input,n维张量。
参数:
- axis,指定增加的维度。axis可以是一个整数或一组整数,整数的取值范围为[-n,n)。
输出:
- output,输出张量。 | | OH_NN_OPS_GELU | 高斯误差线性单元激活函数。output=0.5∗input∗(1+tanh(input/2)),不支持int量化输入。
输入:
- input,一个n维输入张量。
输出:
- output,n维Relu输出张量,数据类型和shape和input一致。 | ### OH_NN_PerformanceMode ``` enum OH_NN_PerformanceMode ``` **描述:** 硬件的性能模式。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_PERFORMANCE_NONE | 无性能模式偏好。 | | OH_NN_PERFORMANCE_LOW | 低能耗模式。 | | OH_NN_PERFORMANCE_MEDIUM | 中性能模式。 | | OH_NN_PERFORMANCE_HIGH | 高性能模式。 | | OH_NN_PERFORMANCE_EXTREME | 极致性能模式。 | ### OH_NN_Priority ``` enum OH_NN_Priority ``` **描述:** 模型推理任务优先级。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_PRIORITY_NONE | 无优先级偏好。 | | OH_NN_PRIORITY_LOW | 低优先级。 | | OH_NN_PRIORITY_MEDIUM | 中优先级。 | | OH_NN_PRIORITY_HIGH | 高优先级。 | ### OH_NN_ReturnCode ``` enum OH_NN_ReturnCode ``` **描述:** Neural Network Runtime定义的错误码类型。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_SUCCESS | 操作成功。 | | OH_NN_FAILED | 操作失败。 | | OH_NN_INVALID_PARAMETER | 非法参数。 | | OH_NN_MEMORY_ERROR | 内存相关的错误,包括:内存不足、内存数据拷贝失败、内存申请失败等。 | | OH_NN_OPERATION_FORBIDDEN | 非法操作。 | | OH_NN_NULL_PTR | 空指针异常。 | | OH_NN_INVALID_FILE | 无效文件。 | | OH_NN_UNAVALIDABLE_DEVICE | 硬件发生错误,错误可能包含:HDL服务崩溃。 | | OH_NN_INVALID_PATH | 非法路径。 | ### OH_NN_TensorType ``` enum OH_NN_TensorType ``` **描述:** 张量的类型。 张量通常用于设置模型的输入、输出和算子参数。 作为模型(或算子)的输入和输出时,需要将张量类型设置为OH_NN_TENSOR;当张量作为算子参数时,需要选择除OH_NN_TENSOR以外合适的枚举值,作为张量的类型。 假设正在设置OH_NN_OPS_CONV2D算子的pad参数,则需要将 [OH_NN_Tensor](_o_h___n_n___tensor.md)实例的type属性设置为OH_NN_CONV2D_PAD。 其他算子参数的设置以此类推,枚举值的命名遵守OH\_NN\_{算子名称}\_{属性名}的格式。 | 枚举值 | 描述 | | -------- | -------- | | OH_NN_TENSOR | 当张量作为模型(或算子)的输入或输出时,使用本枚举值。 | | OH_NN_ADD_ACTIVATIONTYPE | 当张量作为Add算子的activationType参数时,使用本枚举值。 | | OH_NN_AVG_POOL_KERNEL_SIZE | 当张量作为AvgPool算子的kernel_size参数时,使用本枚举值。 | | OH_NN_AVG_POOL_STRIDE | 当张量作为AvgPool算子的stride参数时,使用本枚举值。 | | OH_NN_AVG_POOL_PAD_MODE | 当张量作为AvgPool算子的pad_mode参数时,使用本枚举值。 | | OH_NN_AVG_POOL_PAD | 当张量作为AvgPool算子的pad参数时,使用本枚举值。 | | OH_NN_AVG_POOL_ACTIVATION_TYPE | 当张量作为AvgPool算子的activation_type参数时,使用本枚举值。 | | OH_NN_BATCH_NORM_EPSILON | 当张量作为BatchNorm算子的eosilon参数时,使用本枚举值。 | | OH_NN_BATCH_TO_SPACE_ND_BLOCKSIZE | 当张量作为BatchToSpaceND算子的blockSize参数时,使用本枚举值。 | | OH_NN_BATCH_TO_SPACE_ND_CROPS | 当张量作为BatchToSpaceND算子的crops参数时,使用本枚举值。 | | OH_NN_CONCAT_AXIS | 当张量作为Concat算子的axis参数时,使用本枚举值。 | | OH_NN_CONV2D_STRIDES | 当张量作为Conv2D算子的strides参数时,使用本枚举值。 | | OH_NN_CONV2D_PAD | 当张量作为Conv2D算子的pad参数,使用本枚举值。 | | OH_NN_CONV2D_DILATION | 当张量作为Conv2D算子的dilation参数时,使用本枚举值。 | | OH_NN_CONV2D_PAD_MODE | 当张量作为Conv2D算子的padMode参数时,使用本枚举值。 | | OH_NN_CONV2D_ACTIVATION_TYPE | 当张量作为Conv2D算子的activationType参数时,使用本枚举值。 | | OH_NN_CONV2D_GROUP | 当张量作为Conv2D算子的group参数时,使用本枚举值。 | | OH_NN_CONV2D_TRANSPOSE_STRIDES | 当张量作为Conv2DTranspose算子的strides参数时,使用本枚举值。 | | OH_NN_CONV2D_TRANSPOSE_PAD | 当张量作为Conv2DTranspose算子的pad参数时,使用本枚举值。 | | OH_NN_CONV2D_TRANSPOSE_DILATION | 当张量作为Conv2DTranspose算子的dilation参数时,使用本枚举值。 | | OH_NN_CONV2D_TRANSPOSE_OUTPUT_PADDINGS | 当张量作为Conv2DTranspose算子的outputPaddings参数时,使用本枚举值。 | | OH_NN_CONV2D_TRANSPOSE_PAD_MODE | 当张量作为Conv2DTranspose算子的padMode参数时,使用本枚举值。 | | OH_NN_CONV2D_TRANSPOSE_ACTIVATION_TYPE | 当张量作为Conv2DTranspose算子的activationType参数时,使用本枚举值。 | | OH_NN_CONV2D_TRANSPOSE_GROUP | 当张量作为Conv2DTranspose算子的group参数时,使用本枚举值。 | | OH_NN_DEPTHWISE_CONV2D_NATIVE_STRIDES | 当张量作为DepthwiseConv2dNative算子的strides参数时,使用本枚举值。 | | OH_NN_DEPTHWISE_CONV2D_NATIVE_PAD | 当张量作为DepthwiseConv2dNative算子的pad参数时,使用本枚举值。 | | OH_NN_DEPTHWISE_CONV2D_NATIVE_DILATION | 当张量作为DepthwiseConv2dNative算子的dilation参数时,使用本枚举值。 | | OH_NN_DEPTHWISE_CONV2D_NATIVE_PAD_MODE | 当张量作为DepthwiseConv2dNative算子的padMode参数时,使用本枚举值。 | | OH_NN_DEPTHWISE_CONV2D_NATIVE_ACTIVATION_TYPE | 当张量作为DepthwiseConv2dNative算子的activationType参数时,使用本枚举值。 | | OH_NN_DIV_ACTIVATIONTYPE | 当张量作为Div算子的activationType参数时,使用本枚举值。 | | OH_NN_ELTWISE_MODE | 当张量作为Eltwise算子的mode参数时,使用本枚举值。 | | OH_NN_FULL_CONNECTION_AXIS | 当张量作为FullConnection算子的axis参数时,使用本枚举值。 | | OH_NN_FULL_CONNECTION_ACTIVATIONTYPE | 当张量作为FullConnection算子的activationType参数时,使用本枚举值。 | | OH_NN_MATMUL_TRANSPOSE_A | 当张量作为Matmul算子的transposeA参数时,使用本枚举值。 | | OH_NN_MATMUL_TRANSPOSE_B | 当张量作为Matmul算子的transposeB参数时,使用本枚举值。 | | OH_NN_MATMUL_ACTIVATION_TYPE | 当张量作为Matmul算子的activationType参数时,使用本枚举值。 | | OH_NN_MAX_POOL_KERNEL_SIZE | 当张量作为MaxPool算子的kernel_size参数时,使用本枚举值。 | | OH_NN_MAX_POOL_STRIDE | 当张量作为MaxPool算子的stride参数时,使用本枚举值。 | | OH_NN_MAX_POOL_PAD_MODE | 当张量作为MaxPool算子的pad_mode参数时,使用本枚举值。 | | OH_NN_MAX_POOL_PAD | 当张量作为MaxPool算子的pad参数时,使用本枚举值。 | | OH_NN_MAX_POOL_ACTIVATION_TYPE | 当张量作为MaxPool算子的activation_type参数时,使用本枚举值。 | | OH_NN_MUL_ACTIVATION_TYPE | 当张量作为Mul算子的activationType参数时,使用本枚举值。 | | OH_NN_ONE_HOT_AXIS | 当张量作为OneHot算子的axis参数时,使用本枚举值。 | | OH_NN_PAD_CONSTANT_VALUE | 当张量作为Pad算子的constant_value参数时,使用本枚举值。 | | OH_NN_SCALE_ACTIVATIONTYPE | 当张量作为Scale算子的activationType参数时,使用本枚举值。 | | OH_NN_SCALE_AXIS | 当张量作为Scale算子的axis参数时,使用本枚举值。 | | OH_NN_SOFTMAX_AXIS | 当张量作为Softmax算子的axis参数时,使用本枚举值。 | | OH_NN_SPACE_TO_BATCH_ND_BLOCK_SHAPE | 当张量作为SpaceToBatchND算子的BlockShape参数时,使用本枚举值。 | | OH_NN_SPACE_TO_BATCH_ND_PADDINGS | 当张量作为SpaceToBatchND算子的Paddings参数时,使用本枚举值。 | | OH_NN_SPLIT_AXIS | 当张量作为Split算子的Axis参数时,使用本枚举值。 | | OH_NN_SPLIT_OUTPUT_NUM | 当张量作为Split算子的OutputNum参数时,使用本枚举值。 | | OH_NN_SPLIT_SIZE_SPLITS | 当张量作为Split算子的SizeSplits参数时,使用本枚举值。 | | OH_NN_SQUEEZE_AXIS | 当张量作为Squeeze算子的Axis参数时,使用本枚举值。 | | OH_NN_STACK_AXIS | 当张量作为Stack算子的Axis参数时,使用本枚举值。 | | OH_NN_STRIDED_SLICE_BEGIN_MASK | 当张量作为StridedSlice算子的BeginMask参数时,使用本枚举值。 | | OH_NN_STRIDED_SLICE_END_MASK | 当张量作为StridedSlice算子的EndMask参数时,使用本枚举值。 | | OH_NN_STRIDED_SLICE_ELLIPSIS_MASK | 当张量作为StridedSlice算子的EllipsisMask参数时,使用本枚举值。 | | OH_NN_STRIDED_SLICE_NEW_AXIS_MASK | 当张量作为StridedSlice算子的NewAxisMask参数时,使用本枚举值。 | | OH_NN_STRIDED_SLICE_SHRINK_AXIS_MASK | 当张量作为StridedSlice算子的ShrinkAxisMask参数时,使用本枚举值。 | | OH_NN_SUB_ACTIVATIONTYPE | 当张量作为Sub算子的ActivationType参数时,使用本枚举值。 | | OH_NN_REDUCE_MEAN_KEEP_DIMS | 当张量作为ReduceMean算子的keep_dims参数时,使用本枚举值。 | | OH_NN_RESIZE_BILINEAR_NEW_HEIGHT | 当张量作为ResizeBilinear算子的new_height参数时,使用本枚举值。 | | OH_NN_RESIZE_BILINEAR_NEW_WIDTH | 当张量作为ResizeBilinear算子的new_width参数时,使用本枚举值。 | | OH_NN_RESIZE_BILINEAR_PRESERVE_ASPECT_RATIO | 当张量作为ResizeBilinear算子的preserve_aspect_ratio参数时,使用本枚举值。 | | OH_NN_RESIZE_BILINEAR_COORDINATE_TRANSFORM_MODE | 当张量作为ResizeBilinear算子的coordinate_transform_mode参数时,使用本枚举值。 | | OH_NN_RESIZE_BILINEAR_EXCLUDE_OUTSIDE | 当张量作为ResizeBilinear算子的exclude_outside参数时,使用本枚举值。 | | OH_NN_LAYER_NORM_BEGIN_NORM_AXIS | 当张量作为LayerNorm算子的beginNormAxis参数时,使用本枚举值。 | | OH_NN_LAYER_NORM_EPSILON | 当张量作为LayerNorm算子的epsilon参数时,使用本枚举值。 | | OH_NN_LAYER_NORM_BEGIN_PARAM_AXIS | 当张量作为LayerNorm算子的beginParamsAxis参数时,使用本枚举值。 | | OH_NN_LAYER_NORM_ELEMENTWISE_AFFINE | 当张量作为LayerNorm算子的elementwiseAffine参数时,使用本枚举值。 | | OH_NN_REDUCE_PROD_KEEP_DIMS | 当张量作为ReduceProd算子的keep_dims参数时,使用本枚举值。 | | OH_NN_REDUCE_ALL_KEEP_DIMS | 当张量作为ReduceAll算子的keep_dims参数时,使用本枚举值。 | | OH_NN_QUANT_DTYPE_CAST_SRC_T | 当张量作为QuantDTypeCast算子的src_t参数时,使用本枚举值。 | | OH_NN_QUANT_DTYPE_CAST_DST_T | 当张量作为QuantDTypeCast算子的dst_t参数时,使用本枚举值。 | | OH_NN_TOP_K_SORTED | 当张量作为Topk算子的Sorted参数时,使用本枚举值。 | | OH_NN_ARG_MAX_AXIS | 当张量作为ArgMax算子的axis参数时,使用本枚举值。 | | OH_NN_ARG_MAX_KEEPDIMS | 当张量作为ArgMax算子的keepDims参数时,使用本枚举值。 | | OH_NN_UNSQUEEZE_AXIS | 当张量作为Unsqueeze算子的Axis参数时,使用本枚举值。 | ## **函数说明** ### OH_NNCompilation_Build() ``` OH_NN_ReturnCode OH_NNCompilation_Build (OH_NNCompilation * compilation) ``` **描述:** 进行模型编译。 完成编译配置后,调用本方法指示模型编译已完成。编译实例将模型和编译选项推送至硬件设备进行编译。 在调用本方法后,无法进行额外的编译操作,调用 [OH_NNCompilation_SetDevice](#oh_nncompilation_setdevice)、[OH_NNCompilation_SetCache](#oh_nncompilation_setcache)、 [OH_NNCompilation_SetPerformanceMode](#oh_nncompilation_setperformancemode)、 [OH_NNCompilation_SetPriority](#oh_nncompilation_setpriority)和[OH_NNCompilation_EnableFloat16](#oh_nncompilation_enablefloat16) 方法将返回OH_NN_OPERATION_FORBIDDEN。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNCompilation_Construct() ``` OH_NNCompilation* OH_NNCompilation_Construct (const OH_NNModel * model) ``` **描述:** 创建[OH_NNCompilation](#oh_nncompilation)类型的编译实例。 使用OH_NNModel模块完成模型的构造后,借助OH_NNCompilation模块提供的接口,将模型传递到底层硬件完成编译。本方法接受一个 [OH_NNModel](#oh_nnmodel)实例,创建出[OH_NNCompilation](#oh_nncompilation)实例;通过 [OH_NNCompilation_SetDevice](#oh_nncompilation_setdevice)方法,设置编译的设备,最后调用 [OH_NNCompilation_Build](#oh_nncompilation_build)完成编译。 除了计算硬件的选择,OH_NNCompilation模块支持模型缓存、性能偏好、优先级设置、float16计算等特性,参考以下方法: - [OH_NNCompilation_SetCache](#oh_nncompilation_setcache) - [OH_NNCompilation_SetPerformanceMode](#oh_nncompilation_setperformancemode) - [OH_NNCompilation_SetPriority](#oh_nncompilation_setpriority) - [OH_NNCompilation_EnableFloat16](#oh_nncompilation_enablefloat16) 调用本方法创建[OH_NNCompilation](#oh_nncompilation)后,[OH_NNModel](#oh_nnmodel)实例可以释放。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的指针。 | **返回:** 返回一个指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 ### OH_NNCompilation_Destroy() ``` void OH_NNCompilation_Destroy (OH_NNCompilation ** compilation) ``` **描述:** 释放Compilation对象。 调用[OH_NNCompilation_Construct](#oh_nncompilation_construct)创建的编译实例需要调用本方法主动释放,否则将造成内存泄漏。 如果compilation为空指针或者\*compilation为空指针,本方法只打印warning日志,不执行释放逻辑。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的二级指针。编译实例销毁后,本方法将\*compilation主动设置为空指针。 | ### OH_NNCompilation_EnableFloat16() ``` OH_NN_ReturnCode OH_NNCompilation_EnableFloat16 (OH_NNCompilation * compilation, bool enableFloat16 ) ``` **描述:** 是否以float16的浮点数精度计算。 Neural Network Runtime目前仅支持构造float32浮点模型和int8量化模型。在支持float16精度的硬件上调用本方法, float32浮点数精度的模型将以float16的精度执行计算,以减少内存占用和执行时间。 在不支持float16精度计算的硬件上调用本方法,将返回OH_NN_UNAVALIDABLE_DEVICE错误码。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 | | enableFloat16 | Float16低精度计算标志位。设置为true时,执行Float16推理;设置为false时,执行float32推理。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNCompilation_SetCache() ``` OH_NN_ReturnCode OH_NNCompilation_SetCache (OH_NNCompilation * compilation, const char * cachePath, uint32_t version ) ``` **描述:** 设置编译后的模型缓存路径和缓存版本。 在支持缓存的硬件上,模型在硬件驱动层编译后可以保存为缓存文件,下次编译时直接从缓存文件读取模型,减少重新编译的耗时。本方法接受缓存路径和版本,根据缓存 路径中和版本的不同情况,本方法采取不同的行为: - 缓存路径指定的目录下没有文件: 将编译后的模型缓存到目录下,设置缓存版本等于version。 - 缓存路径指定的目录下存在完整的缓存文件,且版本号 == version: 读取路径下的缓存文件,传递到底层硬件中转换为可以执行的模型实例。 - 缓存路径指定的目录下存在完整的缓存文件,但版本号 < version: 路径下的缓存文件需要更新,模型在底层硬件完成编译后,覆写路径下的缓存文件,将版本号更新为version。 - 缓存路径指定的目录下存在完整的缓存文件,但版本号 > version: 路径下的缓存文件版本高于version,不读取缓存文件,同时返回OH_NN_INVALID_PARAMETER错误码。 - 缓存路径指定的目录下的缓存文件不完整或没有缓存文件的访问权限: 返回OH_NN_INVALID_FILE错误码。 - 缓存目录不存在,或者没有访问权限: 返回OH_NN_INVALID_PATH错误码。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 | | cachePath | 模型缓存文件目录,本方法在cachePath目录下为不同的硬件创建缓存目录。建议每个模型使用单独的缓存目录。 | | version | 缓存版本。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNCompilation_SetDevice() ``` OH_NN_ReturnCode OH_NNCompilation_SetDevice (OH_NNCompilation * compilation, size_t deviceID ) ``` **描述:** 指定模型编译和计算的硬件。 编译阶段,需要指定模型编译和执行计算的硬件设备。先调用[OH_NNDevice_GetAllDevicesID](#oh_nndevice_getalldevicesid)获取可用的设备ID,通过[OH_NNDevice_GetType](#oh_nndevice_gettype)和[OH_NNDevice_GetType](#oh_nndevice_gettype)获取设备信息后,将期望编译执行的设备ID传入本方法进行设置。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 | | deviceID | 指定的硬件ID。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNCompilation_SetPerformanceMode() ``` OH_NN_ReturnCode OH_NNCompilation_SetPerformanceMode (OH_NNCompilation * compilation, OH_NN_PerformanceMode performanceMode ) ``` **描述:** 设置模型计算的性能模式。 Neural Network Runtime支持为模型计算设置性能模式,满足低功耗到极致性能的需求。 如果编译阶段没有调用本方法设置性能模式, 编译实例为模型默认分配OH_NN_PERFORMANCE_NONE模式。 在OH_NN_PERFORMANCE_NONE 模式下,硬件按默认的性能模式执行计算。 在不支持性能模式设置的硬件上调用本方法,将返回OH_NN_UNAVALIDABLE_DEVICE错误码。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 | | performanceMode | 指定性能模式,可选的性能模式参考[OH_NN_PerformanceMode](#oh_nn_performancemode)。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNCompilation_SetPriority() ``` OH_NN_ReturnCode OH_NNCompilation_SetPriority (OH_NNCompilation * compilation, OH_NN_Priority priority ) ``` **描述:** 设置模型计算的优先级。 Neural Network Runtime 支持为模型设置计算优先级,优先级仅作用于相同uid进程创建的模型,不同uid进程、不同设备的优先级不会 相互影响。 在不支持优先级设置的硬件上调用本方法,将返回OH_NN_UNAVALIDABLE_DEVICE错误码。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 | | priority | 指定优先级,可选的优先级参考[OH_NN_Priority](#oh_nn_priority)。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNDevice_GetAllDevicesID() ``` OH_NN_ReturnCode OH_NNDevice_GetAllDevicesID (const size_t ** allDevicesID, uint32_t * deviceCount ) ``` **描述:** 获取对接到 Neural Network Runtime 的硬件ID。 每个硬件在 Neural Network Runtime 中存在唯一且固定ID,本方法通过uin32_t数组返回当前设备上已经对接的硬件ID。 硬件ID通过size_t数组返回,数组的每个元素是单个硬件的ID值。数组内存由Neural Network Runtime管理。在下次调用本方法前, 数据指针有效。 **参数:** | 名称 | 描述 | | -------- | -------- | | allDevicesID | 指向size_t数组的指针。要求传入的(\*allDevicesID)为空指针,否则返回OH_NN_INVALID_PARAMETER。 | | deviceCount | uint32_t类型的指针,用于返回(\*allDevicesID)的长度。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNDevice_GetName() ``` OH_NN_ReturnCode OH_NNDevice_GetName (size_t deviceID, const char ** name ) ``` **描述:** 获取指定硬件的类型信息。 通过deviceID指定计算硬件,获取硬件的名称。硬件ID需要调用[OH_NNDevice_GetAllDevicesID](#oh_nndevice_getalldevicesid)获取。 **参数:** | 名称 | 描述 | | -------- | -------- | | deviceID | 指定硬件ID。 | | name | 指向char数组的指针,要求传入的(\*char)为空指针,否则返回OH_NN_INVALID_PARAMETER。
(\*name)以C风格字符串保存硬件名称,数组以'\0'结尾。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNDevice_GetType() ``` OH_NN_ReturnCode OH_NNDevice_GetType (size_t deviceID, OH_NN_DeviceType * deviceType ) ``` **描述:** 获取指定硬件的类别信息。 通过deviceID指定计算硬件,获取硬件的类别。目前 Neural Network Runtime 支持的设备类型有: - CPU设备:OH_NN_CPU - GPU设备:OH_NN_GPU - 机器学习专用加速器:OH_NN_ACCELERATOR - 不属于以上类型的其他硬件类型:OH_NN_OTHERS **参数:** | 名称 | 描述 | | -------- | -------- | | deviceID | 指定硬件ID。 | | deviceType | 指向[OH_NN_DeviceType](#oh_nn_devicetype)实例的指针,返回硬件的类别信息。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNExecutor_AllocateInputMemory() ``` OH_NN_Memory* OH_NNExecutor_AllocateInputMemory (OH_NNExecutor * executor, uint32_t inputIndex, size_t length ) ``` **描述:** 在硬件上为单个输入申请共享内存。 Neural Network Runtime 提供主动申请硬件共享内存的方法。通过指定执行器和输入索引值,本方法在单个输入关联的硬件 上,申请大小为length的共享内存,通过[OH_NN_Memory](_o_h___n_n___memory.md)实例返回。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | inputIndex | 输入的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输入数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,inputIndices为{1,5,9}, 则在申请输入内存时,三个输入的索引值分别为{0,1,2}。 | | length | 申请的内存字节。 | **返回:** 指向[OH_NN_Memory](_o_h___n_n___memory.md)实例的指针。 ### OH_NNExecutor_AllocateOutputMemory() ``` OH_NN_Memory* OH_NNExecutor_AllocateOutputMemory (OH_NNExecutor * executor, uint32_t outputIndex, size_t length ) ``` **描述:** 在硬件上为单个输出申请共享内存。 Neural Network Runtime提供主动申请硬件共享内存的方法。通过指定执行器和输出索引值,本方法在单个输出关联的硬件上,申请大小为length的共享内存,通过[OH_NN_Memory](_o_h___n_n___memory.md)实例返回。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | outputIndex | 输出的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输出数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,outputIndices为{4,6,8}, 则在申请输出内存时,三个输出的索引值分别为{0,1,2}。 | | length | 申请的内存字节。 | **返回:** 指向[OH_NN_Memory](_o_h___n_n___memory.md)实例的指针。 ### OH_NNExecutor_Construct() ``` OH_NNExecutor* OH_NNExecutor_Construct (OH_NNCompilation * compilation) ``` **描述:** 创建[OH_NNExecutor](#oh_nnexecutor)类型的执行器实例 本方法接受一个编译器,构造一个与硬件关联的模型推理执行器。通过[OH_NNExecutor_SetInput](#oh_nnexecutor_setinput)设置模型输入数据, 设置输入数据后,调用[OH_NNExecutor_Run](#oh_nnexecutor_run)方法执行推理,最后通过 [OH_NNExecutor_SetOutput](#oh_nnexecutor_setoutput)获取计算结果。 调用本方法创建[OH_NNExecutor](#oh_nnexecutor)实例后,如果不需要创建其他执行器,可以安全释放[OH_NNCompilation](#oh_nncompilation)实例。 **参数:** | 名称 | 描述 | | -------- | -------- | | compilation | 指向[OH_NNCompilation](#oh_nncompilation)实例的指针。 | **返回:** 返回指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 ### OH_NNExecutor_Destroy() ``` void OH_NNExecutor_Destroy (OH_NNExecutor ** executor) ``` **描述:** 销毁执行器实例,释放执行器占用的内存。 调用[OH_NNExecutor_Construct](#oh_nnexecutor_construct)创建的执行器实例需要调用本方法主动释放,否则将造成内存泄漏。 如果executor为空指针或者\*executor为空指针,本方法只打印warning日志,不执行释放逻辑。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的二级指针。 | ### OH_NNExecutor_DestroyInputMemory() ``` void OH_NNExecutor_DestroyInputMemory (OH_NNExecutor * executor, uint32_t inputIndex, OH_NN_Memory ** memory ) ``` **描述:** 释放[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的输入内存。 调用[OH_NNExecutor_AllocateInputMemory](#oh_nnexecutor_allocateinputmemory)创建的内存实例,需要主动调用本方法进行释放,否则将造成内存泄漏。 inputIndex和memory的对应关系需要和创建内存实例时保持一致。 如果memory或\*memory为空指针,本方法只打印warning日志,不执行释放逻辑。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | inputIndex | 输入的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输入数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,inputIndices为{1,5,9}, 则在执行释放输入内存时,三个输入的索引值分别为{0,1,2}。 | | memory | 指向[OH_NN_Memory](_o_h___n_n___memory.md)实例的二级指针。共享内存销毁后,本方法将\*memory主动设置为空指针。 | ### OH_NNExecutor_DestroyOutputMemory() ``` void OH_NNExecutor_DestroyOutputMemory (OH_NNExecutor * executor, uint32_t outputIndex, OH_NN_Memory ** memory ) ``` **描述:** 释放[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的输出内存。 调用[OH_NNExecutor_AllocateOutputMemory](#oh_nnexecutor_allocateoutputmemory)创建的内存实例,需要主动调用本方法进行释放,否则将造成内存泄漏。 outputIndex和memory的对应关系需要和创建内存实例时保持一致。 如果memory或\*memory为空指针,本方法只打印warning日志,不执行释放逻辑。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | outputIndex | 输出的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输出数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,outputIndices为{4,6,8}, 则在执行释放输出内存时,三个输出的索引值分别为{0,1,2}。 | | memory | 指向[OH_NN_Memory](_o_h___n_n___memory.md)实例的二级指针。共享内存销毁后,本方法将\*memory主动设置为空指针。 | ### OH_NNExecutor_GetOutputShape() ``` OH_NN_ReturnCode OH_NNExecutor_GetOutputShape (OH_NNExecutor * executor, uint32_t outputIndex, int32_t ** shape, uint32_t * shapeLength ) ``` **描述:** 获取输出张量的维度信息。 调用[OH_NNExecutor_Run](#oh_nnexecutor_run)完成单次推理后,本方法获取指定输出的维度信息和维数。在动态形状输入、输出的场景中常用。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | outputIndex | 输出的索引值。与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输出数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,outputIndices为{4,6,8}, 则在获取输出张量维度信息的阶段,三个输出的索引值分别为{0,1,2}。 | | shape | 指向int32_t数组的指针,数组中的每个元素值,是输出张量在每个维度上的长度。 | | shapeLength | uint32_t类型的指针,返回输出的维数。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNExecutor_Run() ``` OH_NN_ReturnCode OH_NNExecutor_Run (OH_NNExecutor * executor) ``` **描述:** 执行推理。 在执行器关联的硬件上,执行模型的端到端推理计算。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNExecutor_SetInput() ``` OH_NN_ReturnCode OH_NNExecutor_SetInput (OH_NNExecutor * executor, uint32_t inputIndex, const OH_NN_Tensor * tensor, const void * dataBuffer, size_t length ) ``` **描述:** 设置模型单个输入的数据。 本方法将dataBuffer中,长度为length个字节的数据,拷贝到底层硬件的共享内存。inputIndex指定设置的输入,tensor用于设置输入的 形状、类型、量化参数等信息。 由于Neural Network Runtime支持动态输入形状的模型,在固定形状输入和动态形状输入的场景下,本方法采取不同的处理策略: - 固定形状输入的场景:tensor各属性必须和构图阶段调用[OH_NNModel_AddTensor](#oh_nnmodel_addtensor)添加的张量保持一致; - 动态形状输入的场景:在构图阶段,由于动态输入的形状不确定,调用本方法时,要求tensor.dimensions中的每个值必须大于0, 以确定执行计算阶段输入的形状。设置形状时,只允许调整数值为-1的维度。假设在构图阶段,输入A的维度为 [-1, 224, 224, 3],调用本方法时,只能调整第一个维度的尺寸,如:[3, 224, 224, 3]。调整其他维度将返回OH_NN_INVALID_PARAMETER。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | inputIndex | 输入的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输入数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,inputIndices为{1,5,9}, 则在设置输入的阶段,三个输入的索引值分别为{0,1,2}。 | | tensor | 设置输入数据对应的张量。 | | dataBuffer | 指向输入数据的指针。 | | length | 数据缓冲区的字节长度。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNExecutor_SetInputWithMemory() ``` OH_NN_ReturnCode OH_NNExecutor_SetInputWithMemory (OH_NNExecutor * executor, uint32_t inputIndex, const OH_NN_Tensor * tensor, const OH_NN_Memory * memory ) ``` **描述:** 将[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的硬件共享内存,指定为单个输入使用的共享内存。 在需要自行管理内存的场景下,本方法将执行输入和[OH_NN_Memory](_o_h___n_n___memory.md)内存实例绑定。执行计算时,底层硬件从内存实例指向的共享内存中读取 输入数据。通过本方法,可以实现设置输入、执行计算、读取输出的并发执行,提升数据流的推理效率。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | inputIndex | 输入的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输入数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,inputIndices为{1,5,9}, 则在指定输入的共享内存时,三个输入的索引值分别为{0,1,2}。 | | tensor | 指向[OH_NN_Tensor](_o_h___n_n___tensor.md)的指针,设置单个输入所对应的张量。 | | memory | 指向[OH_NN_Memory](_o_h___n_n___memory.md)的指针。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNExecutor_SetOutput() ``` OH_NN_ReturnCode OH_NNExecutor_SetOutput (OH_NNExecutor * executor, uint32_t outputIndex, void * dataBuffer, size_t length ) ``` **描述:** 设置模型单个输出的缓冲区。 本方法将dataBuffer指向的缓冲区与outputIndex指定的输出绑定,缓冲区的长度由length指定。 调用[OH_NNExecutor_Run](#oh_nnexecutor_run)完成单次模型推理后,Neural Network Runtime将比对dataBuffer指向的缓冲区与 输出数据的长度,根据不同情况,返回不同结果: - 如果缓冲区大于或等于数据长度:则推理后的结果将拷贝至缓冲区,并返回OH_NN_SUCCESS,可以通过访问dataBuffer读取推理结果。 - 如果缓冲区小于数据长度:则[OH_NNExecutor_Run](#oh_nnexecutor_run)将返回OH_NN_INVALID_PARAMETER, 并输出日志告知缓冲区太小的信息。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 指向[OH_NNExecutor](#oh_nnexecutor)实例的指针。 | | outputIndex | 输出的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输出数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,outputIndices为{4,6,8}, 则设置输出缓冲区时,三个输出的索引值分别为{0,1,2}。 | | dataBuffer | 指向输出数据的指针。 | | length | 数据缓冲区的字节长度。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNExecutor_SetOutputWithMemory() ``` OH_NN_ReturnCode OH_NNExecutor_SetOutputWithMemory (OH_NNExecutor * executor, uint32_t outputIndex, const OH_NN_Memory * memory ) ``` **描述:** 将[OH_NN_Memory](_o_h___n_n___memory.md)实例指向的硬件共享内存,指定为单个输出使用的共享内存。 在需要自行管理内存的场景下,本方法将执行输出和[OH_NN_Memory](_o_h___n_n___memory.md)内存实例绑定。执行计算时,底层硬件将计算结果直接写入内存实例指向 的共享内存。通过本方法,可以实现设置输入、执行计算、读取输出的并发执行,提升数据流的推理效率。 **参数:** | 名称 | 描述 | | -------- | -------- | | executor | 执行器。 | | outputIndex | 输出的索引值,与调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时输出数据的顺序一致。假设调用[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)时,outputIndices为{4,6,8}, 则在指定输出的共享内存时,三个输出的索引值分别为{0,1,2}。 | | memory | 指向[OH_NN_Memory](_o_h___n_n___memory.md)的指针。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNModel_AddOperation() ``` OH_NN_ReturnCode OH_NNModel_AddOperation (OH_NNModel * model, OH_NN_OperationType op, const OH_NN_UInt32Array * paramIndices, const OH_NN_UInt32Array * inputIndices, const OH_NN_UInt32Array * outputIndices ) ``` **描述:** 向模型实例中添加算子。 本方法向模型实例中添加算子,算子类型由op指定,算子的参数、输入和输出由paramIndices、inputIndices和 outputIndices指定。本方法将对算子参数的属性和输入输出的数量进行校验,这些属性需要在调用 [OH_NNModel_AddTensor](#oh_nnmodel_addtensor)添加张量的时候正确设置。每个算子期望的参数、输入和输出属性请参考 [OH_NN_OperationType](#oh_nn_operationtype)。 paramIndices、inputIndices和outputIndices中存储的是张量的索引值,每个索引值根据张量添加进模型的顺序决定,正确 设置并添加算子要求准确设置每个张量的索引值。张量的添加参考[OH_NNModel_AddTensor](#oh_nnmodel_addtensor)。 如果添加算子时,添加了额外的参数(非算子需要的参数),本方法返回OH_NN_INVALID_PARAMETER;如果没有设置算子参数, 则算子按默认值设置缺省的参数,默认值请参考[OH_NN_OperationType](#oh_nn_operationtype)。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的指针。 | | op | 指定添加的算子类型,取值请参考[OH_NN_OperationType](#oh_nn_operationtype)的枚举值。 | | paramIndices | OH_NN_UInt32Array实例的指针,设置算子的参数。 | | inputIndices | OH_NN_UInt32Array实例的指针,指定算子的输入。 | | outputIndices | OH_NN_UInt32Array实例的指针,设置算子的输出。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNModel_AddTensor() ``` OH_NN_ReturnCode OH_NNModel_AddTensor (OH_NNModel * model, const OH_NN_Tensor * tensor ) ``` **描述:** 向模型实例中添加张量。 Neural Network Runtime模型中的数据节点和算子参数均由模型的张量构成。本方法根据tensor,向model实 例中添加张量。张量添加的顺序是模型中记录张量的索引值,[OH_NNModel_SetTensorData](#oh_nnmodel_settensordata)、 [OH_NNModel_AddOperation](#oh_nnmodel_addoperation)和[OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs) 方法根据该索引值,指定不同的张量。 Neural Network Runtime支持动态形状输入和输出。在添加动态形状的数据节点时,需要将tensor.dimensions中支持动态 变化的维度设置为-1。例如:一个四维tensor,将tensor.dimensions设置为[1, -1, 2, 2],表示其第二个维度支持 动态变化。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的指针。 | | tensor | [OH_NN_Tensor](_o_h___n_n___tensor.md)张量的指针,tensor指定了添加到模型实例中张量的属性。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNModel_Construct() ``` OH_NNModel* OH_NNModel_Construct (void ) ``` **描述:** 创建[OH_NNModel](#oh_nnmodel)类型的模型实例,搭配OH_NNModel模块提供的其他接口,完成模型实例的构造。 在开始构图前,先调用[OH_NNModel_Construct](#oh_nnmodel_construct)创建模型实例,根据模型的拓扑结构,调用 [OH_NNModel_AddTensor](#oh_nnmodel_addtensor)、[OH_NNModel_AddOperation](#oh_nnmodel_addoperation)和 [OH_NNModel_SetTensorData](#oh_nnmodel_settensordata)方法,填充模型的数据节点和算子节点;然后调用 [OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)指定模型的输入和输出;当构造完模型的拓扑结构,调用 [OH_NNModel_Finish](#oh_nnmodel_finish)完成模型的构建。 模型实例使用完毕后,需要调用[OH_NNModel_Destroy](#oh_nnmodel_destroy)销毁模型实例,避免内存泄漏。 **返回:** 返回一个指向[OH_NNModel](#oh_nnmodel)实例的指针。 ### OH_NNModel_Destroy() ``` void OH_NNModel_Destroy (OH_NNModel ** model) ``` **描述:** 释放模型实例。 调用[OH_NNModel_Construct](#oh_nnmodel_construct)创建的模型实例需要调用本方法主动释放,否则将造成内存泄漏。 如果model为空指针或者\*model为空指针,本方法只打印warning日志,不执行释放逻辑。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的二级指针。模型实例销毁后,本方法将\*model主动设置为空指针。 | ### OH_NNModel_Finish() ``` OH_NN_ReturnCode OH_NNModel_Finish (OH_NNModel * model) ``` **描述:** 完成模型构图。 完成模型拓扑结构的搭建后,调用本方法指示构图已完成。 在调用本方法后,无法进行额外的构图操作,调用 [OH_NNModel_AddTensor](#oh_nnmodel_addtensor)、[OH_NNModel_AddOperation](#oh_nnmodel_addoperation)、 [OH_NNModel_SetTensorData](#oh_nnmodel_settensordata)和 [OH_NNModel_SpecifyInputsAndOutputs](#oh_nnmodel_specifyinputsandoutputs)将返回OH_NN_OPERATION_FORBIDDEN。 在调用[OH_NNModel_GetAvailableOperations](#oh_nnmodel_getavailableoperations)和[OH_NNCompilation_Construct](#oh_nncompilation_construct) 之前,必须先调用本方法完成构图。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的指针。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNModel_GetAvailableOperations() ``` OH_NN_ReturnCode OH_NNModel_GetAvailableOperations (OH_NNModel * model, size_t deviceID, const bool ** isSupported, uint32_t * opCount ) ``` **描述:** 查询硬件对模型内所有算子的支持情况,通过布尔值序列指示支持情况。 查询底层硬件对模型实例内每个算子的支持情况,硬件由deviceID指定,结果将通过isSupported指向的数组表示。如果支持第i个算子,则 (\*isSupported)[i] == true,否则为 false。 本方法成功执行后,(\*isSupported)将指向记录算子支持情况的bool数组,数组长度和模型实例的算子数量相等。该数组对应的内存由 Neural Network Runtime管理,在模型实例销毁或再次调用本方法后自动销毁。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的指针。 | | deviceID | 指定查询的硬件ID,通过[OH_NNDevice_GetAllDevicesID](#oh_nndevice_getalldevicesid)获取。 | | isSupported | 指向bool数组的指针。调用本方法时,要求(\*isSupported)为空指针,否则返回OH_NN_INVALID_PARAMETER。 | | opCount | 模型实例中算子的数量,对应(\*isSupported)数组的长度。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNModel_SetTensorData() ``` OH_NN_ReturnCode OH_NNModel_SetTensorData (OH_NNModel * model, uint32_t index, const void * dataBuffer, size_t length ) ``` **描述:** 设置张量的数值。 对于具有常量值的张量(如模型的权重),需要在构图阶段使用本方法设置数值。张量的索引值根据张量添加进模型的顺序决定,张量的添加参考 [OH_NNModel_AddTensor](#oh_nnmodel_addtensor)。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的指针。 | | index | 张量的索引值。 | | dataBuffer | 指向真实数据的指针。 | | length | 数据缓冲区的长度。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。 ### OH_NNModel_SpecifyInputsAndOutputs() ``` OH_NN_ReturnCode OH_NNModel_SpecifyInputsAndOutputs (OH_NNModel * model, const OH_NN_UInt32Array * inputIndices, const OH_NN_UInt32Array * outputIndices ) ``` **描述:** 指定模型的输入输出。 模型实例需要指定张量作为端到端的输入和输出,设置为输入和输出的张量不能使用[OH_NNModel_SetTensorData](#oh_nnmodel_settensordata)设置 数值,需要在执行阶段调用OH_NNExecutor的方法设置输入、输出数据。 张量的索引值根据张量添加进模型的顺序决定,张量的添加参考 [OH_NNModel_AddTensor](#oh_nnmodel_addtensor)。 暂时不支持异步设置模型输入输出。 **参数:** | 名称 | 描述 | | -------- | -------- | | model | 指向[OH_NNModel](#oh_nnmodel)实例的指针。 | | inputIndices | OH_NN_UInt32Array实例的指针,指定算子的输入。 | | outputIndices | OH_NN_UInt32Array实例的指针,指定算子的输出。 | **返回:** 函数执行的结果状态。执行成功返回OH_NN_SUCCESS;失败返回具体错误码,具体失败错误码可参考[OH_NN_ReturnCode](#oh_nn_returncode)。