OpenHarmony-v5.1.0-Release/s

/**
 * Copyright 2020-2023 Huawei Technologies Co., Ltd
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 * http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

#ifndef MINDSPORE_LITE_SRC_RUNTIME_KERNEL_EXEC_H_
#define MINDSPORE_LITE_SRC_RUNTIME_KERNEL_EXEC_H_
#include <string>
#include <vector>
#include <memory>
#include <utility>
#include <algorithm>
#include "src/common/utils.h"
#include "src/common/log_util.h"
#ifdef ENABLE_ARM
#include <arm_neon.h>
#endif
#include "nnacl/op_base.h"
#include "src/litert/inner_context.h"
#include "src/tensor.h"
#include "include/errorcode.h"
#include "include/api/kernel.h"
#include "src/litert/cxx_api/tensor/tensor_impl.h"
#include "src/litert/lite_kernel.h"
#include "include/api/delegate.h"
#include "extendrt/mindir_loader/abstract_kernel.h"
#include "include/lite_types.h"
#include "src/infer/primitive_type.h"
#include "src/infer/tensor.h"
#include "src/infer/context.h"

namespace mindspore::lite {
using KernelCallBack = std::function<bool(std::vector<lite::Tensor *> inputs, std::vector<lite::Tensor *> outputs,
                                          const MSCallBackParam &opInfo)>;
}

using mindspore::infer::Abstractkernel;
using mindspore::lite::KernelCallBack;

namespace mindspore::kernel {
enum KERNEL_ARCH { kCPU, kGPU, kAPU, kNPU, kCustom, kDelegate, kACL, kKernelArch_MIN = kCPU, kKernelArch_MAX = kAPU };
static const char *const kBuiltin = "Builtin";

struct KernelKey {
  KERNEL_ARCH arch = kCPU;
  TypeId data_type = kTypeUnknown;
  Format format = Format::NHWC;
  int type = 0;
  std::string kernel_arch;
  std::string provider{kBuiltin};

  bool operator==(const KernelKey &dst) const {
    return type == dst.type && kernel_arch == dst.kernel_arch && provider == dst.provider && arch == dst.arch &&
           data_type == dst.data_type && format == dst.format;
  }
};

enum SubGraphType {
  kNotSubGraph = 0,
  kCpuFP32SubGraph,
  kCpuFP16SubGraph,
  kGpuFp32SubGraph,
  kGpuFp16SubGraph,
  kNpuSubGraph,
  kApuSubGraph,
  kCustomSubGraph,
  kEntranceSubGraph,
  kExitSubGraph,
  kStackSubGraph,
  kAclSubGraph
};

class KernelExec {
 public:
  KernelExec() {
    this->in_kernels_.clear();
    this->out_kernels_.clear();
  }

  explicit KernelExec(std::shared_ptr<MSKernel> kernel) : kernel_(std::move(kernel)) {
    this->in_kernels_.clear();
    this->out_kernels_.clear();
  }

  virtual ~KernelExec() = default;

  virtual int Execute() { return DoExecute(); }

  virtual int Execute(const KernelCallBack &before, const KernelCallBack &after) {
    if (before != nullptr) {
      if (!before(this->in_tensors(), this->out_tensors(), {this->name(), TypeName(type())})) {
        MS_LOG(WARNING) << "run kernel before_callback failed, name: " << this->name();
      }
    }

    auto ret = DoExecute();

    if (after != nullptr) {
      if (!after(this->in_tensors(), this->out_tensors(), {this->name(), TypeName(type())})) {
        MS_LOG(WARNING) << "run kernel after_callback failed, name: " << this->name();
      }
    }
    return ret;
  }

  // called while compiling graph
  virtual int Prepare() {
    MS_ASSERT(kernel_ != nullptr);
    return kernel_->Prepare();
  }

  virtual bool IsBuiltin() { return desc_.provider == kBuiltin; }

  virtual int InferShape() { return kernel_->InferShape(); }

  virtual int ReSize() {
    MS_ASSERT(kernel_ != nullptr);
    return kernel_->ReSize();
  }

  virtual OpParameter *op_parameter() const {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<LiteKernel>(kernel_)->op_parameter();
    }
    return nullptr;
  }

  std::string name() const {
    MS_ASSERT(kernel_ != nullptr);
    return kernel_->name();
  }

  void set_name(const std::string &name) {
    MS_ASSERT(kernel_ != nullptr);
    kernel_->set_name(name);
  }

  virtual int Train() {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<Abstractkernel>(kernel_)->Train();
    }
    return mindspore::lite::RET_OK;
  }

  virtual bool IsTrain() const {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<Abstractkernel>(kernel_)->IsTrain();
    }
    return false;
  }

  virtual int Eval() {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<Abstractkernel>(kernel_)->Eval();
    }
    return mindspore::lite::RET_OK;
  }

  virtual bool IsEval() const {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<Abstractkernel>(kernel_)->IsEval();
    }
    return false;
  }

  virtual void SetTrainable(bool trainable = true) {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      std::static_pointer_cast<Abstractkernel>(kernel_)->SetTrainable(trainable);
    }
  }

  virtual bool IsTrainable() const {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<Abstractkernel>(kernel_)->IsTrainable();
    }
    return false;
  }

  int DoExecute();

  void set_is_model_output(bool is_model_output) { this->is_model_output_ = is_model_output; }

  bool is_model_output() const { return this->is_model_output_; }

  bool InferShapeDone() const {
    auto checker = context_ != nullptr ? context_->get_infer_checker() : lite::InferCheckerOutput;
    return checker != nullptr && checker(in_tensors(), out_tensors());
  }

  virtual PrimitiveType type() const {
    MS_ASSERT(kernel_ != nullptr);
    return PrimitiveType(std::static_pointer_cast<Abstractkernel>(kernel_)->type());
  }

  virtual void set_in_tensors(const std::vector<lite::Tensor *> &in_tensors) {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      std::static_pointer_cast<Abstractkernel>(kernel_)->set_in_tensors(in_tensors);
    } else {
      std::vector<MSTensor> tensors_in;
      (void)std::transform(in_tensors.begin(), in_tensors.end(), std::back_inserter(tensors_in),
                           [](lite::Tensor *tensor) {
                             auto impl = std::make_shared<mindspore::LiteTensorImpl>(tensor);
                             return mindspore::MSTensor(impl);
                           });
      kernel_->set_inputs(tensors_in);
    }
  }

  virtual void set_in_tensor(lite::Tensor *in_tensor, size_t index) {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      std::static_pointer_cast<Abstractkernel>(kernel_)->set_in_tensor(in_tensor, index);
    } else {
      MS_ASSERT(index < kernel_->inputs().size());
      auto impl = std::make_shared<mindspore::LiteTensorImpl>(in_tensor);
      auto tensor_in = mindspore::MSTensor(impl);
      kernel_->set_input(tensor_in, static_cast<int>(index));
    }
  }

  virtual void set_out_tensors(const std::vector<lite::Tensor *> &out_tensors) {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      std::static_pointer_cast<Abstractkernel>(kernel_)->set_out_tensors(out_tensors);
    } else {
      std::vector<MSTensor> tensors_out;
      (void)std::transform(out_tensors.begin(), out_tensors.end(), std::back_inserter(tensors_out),
                           [](lite::Tensor *tensor) {
                             auto impl = std::make_shared<mindspore::LiteTensorImpl>(tensor);
                             return mindspore::MSTensor(impl);
                           });
      kernel_->set_outputs(tensors_out);
    }
  }

  virtual void set_out_tensor(lite::Tensor *out_tensor, size_t index) {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      std::static_pointer_cast<Abstractkernel>(kernel_)->set_out_tensor(out_tensor, index);
    } else {
      MS_ASSERT(index < kernel_->outputs().size());
      auto impl = std::make_shared<mindspore::LiteTensorImpl>(out_tensor);
      auto tensor_out = mindspore::MSTensor(impl);
      kernel_->set_output(tensor_out, static_cast<int>(index));
    }
  }

  virtual const std::vector<lite::Tensor *> &in_tensors() const {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<Abstractkernel>(kernel_)->in_tensors();
    } else {
      auto &ms_tensors = kernel_->inputs();
      mutable_in_tensors_.resize(ms_tensors.size());
      (void)std::transform(ms_tensors.begin(), ms_tensors.end(), mutable_in_tensors_.begin(),
                           [](const mindspore::MSTensor &tensor) {
                             if (tensor.impl() == nullptr) {
                               MS_LOG(ERROR) << "Tensor " << tensor.Name() << " is nullptr.";
                               return static_cast<lite::Tensor *>(nullptr);
                             }
                             auto lite_impl = std::static_pointer_cast<LiteTensorImpl>(tensor.impl());
                             return static_cast<lite::Tensor *>(lite_impl->lite_tensor());
                           });
      return mutable_in_tensors_;
    }
  }

  virtual const std::vector<lite::Tensor *> &out_tensors() const {
    MS_ASSERT(kernel_ != nullptr);
    if (desc_.provider == kBuiltin) {
      return std::static_pointer_cast<Abstractkernel>(kernel_)->out_tensors();
    } else {
      auto &ms_tensors = kernel_->outputs();
      mutable_out_tensors_.resize(ms_tensors.size());
      (void)std::transform(ms_tensors.begin(), ms_tensors.end(), mutable_out_tensors_.begin(),
                           [](const mindspore::MSTensor &tensor) {
                             if (tensor.impl() == nullptr) {
                               MS_LOG(ERROR) << "Tensor " << tensor.Name() << " is nullptr.";
                               return static_cast<lite::Tensor *>(nullptr);
                             }
                             auto lite_impl = std::static_pointer_cast<LiteTensorImpl>(tensor.impl());
                             return static_cast<lite::Tensor *>(lite_impl->lite_tensor());
                           });
      return mutable_out_tensors_;
    }
  }

  void AddInKernel(KernelExec *kernel) {
    if (!lite::IsContain(this->in_kernels_, kernel)) {
      this->in_kernels_.emplace_back(kernel);
    }
  }

  void AddOutKernel(KernelExec *kernel) {
    if (!lite::IsContain(this->out_kernels_, kernel)) {
      this->out_kernels_.emplace_back(kernel);
    }
  }

  std::vector<size_t> FindAllInTensorIndex(const lite::Tensor *tensor) {
    std::vector<size_t> indexes;
    for (size_t i = 0; i < in_tensors().size(); i++) {
      if (tensor == in_tensors().at(i)) {
        indexes.emplace_back(i);
      }
    }
    return indexes;
  }

  size_t FindOutTensorIndex(const lite::Tensor *tensor) {
    size_t index = 0;
    for (size_t i = 0; i < out_tensors().size(); i++) {
      if (tensor == out_tensors().at(i)) {
        index = i;
        break;
      }
    }
    return index;
  }

  void RemoveInKernel(KernelExec *kernel) { (void)lite::VectorErase(&(this->in_kernels_), kernel); }

  void RemoveOutKernel(KernelExec *kernel) { (void)lite::VectorErase(&(this->out_kernels_), kernel); }

  void set_in_kernels(const std::vector<KernelExec *> &kernel) { this->in_kernels_ = kernel; }

  void set_out_kernels(const std::vector<KernelExec *> &kernel) { this->out_kernels_ = kernel; }

  const std::vector<KernelExec *> &in_kernels() const { return this->in_kernels_; }

  const std::vector<KernelExec *> &out_kernels() const { return this->out_kernels_; }

  virtual bool IsReady(const std::vector<lite::Tensor *> &in_tensor);

  virtual void InitOutTensorInitRefCount(const std::vector<KernelExec *> *mask_kernels = nullptr);

  KernelKey desc() const { return desc_; }

  void set_desc(const KernelKey &kernel_key) { desc_ = kernel_key; }

  SubGraphType subgraph_type() const { return this->subgraph_type_; }

  void set_context(const lite::InnerContext *context) { context_ = context; }

  const lite::InnerContext *Context() const { return context_; }

  virtual std::string ToString() const;

  MSKernel *kernel() const { return kernel_.get(); }

  void SetOpenGLTextureEnable(bool enable) { enable_gl_texture_ = enable; }

  bool GetOpenGLTextureEnable() const { return enable_gl_texture_; }

 protected:
  Kernel *get_schema_primitive_kernel() const { return reinterpret_cast<Kernel *>(kernel_.get()); }

  std::shared_ptr<MSKernel> kernel_ = nullptr;
  KernelKey desc_;
  // tensor will free in ~lite_session()
  std::vector<KernelExec *> in_kernels_;
  std::vector<KernelExec *> out_kernels_;
  mutable std::vector<lite::Tensor *> mutable_in_tensors_;
  mutable std::vector<lite::Tensor *> mutable_out_tensors_;
  bool is_model_output_ = false;
  SubGraphType subgraph_type_ = kNotSubGraph;
  const lite::InnerContext *context_ = nullptr;
  bool enable_gl_texture_ = false;
};

typedef LiteKernel *(*KernelCreator)(const std::vector<lite::Tensor *> &inputs,
                                     const std::vector<lite::Tensor *> &outputs, OpParameter *parameter,
                                     const lite::InnerContext *ctx, const KernelKey &desc);

template <class T>
LiteKernel *LiteKernelCreator(const std::vector<lite::Tensor *> &inputs, const std::vector<lite::Tensor *> &outputs,
                              OpParameter *parameter, const lite::InnerContext *ctx, const kernel::KernelKey &desc) {
  if (parameter == nullptr) {
    MS_LOG(ERROR) << "parameter is nullptr.";
    return nullptr;
  }
  if (desc.data_type == kTypeUnknown) {
    MS_LOG(WARNING) << "desc data_type is unknown.";
  }
  auto *kernel = new (std::nothrow) T(parameter, inputs, outputs, ctx);
  if (kernel == nullptr) {
    MS_LOG(ERROR) << "kernel: " << parameter->name_ << "is nullptr.";
    free(parameter);
    return nullptr;
  }
  return kernel;
}
}  // namespace mindspore::kernel

#endif  // MINDSPORE_LITE_SRC_RUNTIME_KERNEL_EXEC_H_