OpenHarmony-v6.0-Release/s

/**
 * Copyright 2022-2023 Huawei Technologies Co., Ltd
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 * http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

#ifndef MINDSPORE_CCSRC_PIPELINE_PYNATIVE_FORWARD_FORWARD_H_
#define MINDSPORE_CCSRC_PIPELINE_PYNATIVE_FORWARD_FORWARD_H_

#include <memory>
#include <string>
#include <map>
#include <utility>
#include <stack>
#include <vector>
#include "pipeline/pynative/forward/do_cast.h"
#include "pipeline/pynative/forward/do_pyboost_cast.h"
#include "pipeline/pynative/forward/do_infer.h"
#include "backend/graph_compiler/backend.h"
#include "ir/cell.h"
#include "runtime/pipeline/async_hqueue.h"
#include "ops/view/view_strides_calculator.h"
#include "runtime/pipeline/async_rqueue.h"

namespace mindspore {
namespace pynative {
class GradExecutor;
using GradExecutorPtr = std::shared_ptr<GradExecutor>;
using GradExecutorWeakPtr = std::weak_ptr<GradExecutor>;

using MindrtBackendMap = std::map<std::string, std::shared_ptr<compile::MindRTBackend>>;

class ForwardExecutor {
 public:
  ForwardExecutor()
      : cast_operation_(std::make_shared<CastOperation>()),
        pyboost_cast_operation_(std::make_shared<PyBoostCastOperation>()),
        infer_operation_(std::make_shared<InferOperation>()) {}
  ~ForwardExecutor() = default;

  void Init();
  std::function<void(const FrontendOpRunInfoPtr &)> RunOpS = [this](auto &&PH1) {
    RunOpFrontend(std::forward<decltype(PH1)>(PH1));
  };

  void DispatchFrontendTask(const FrontendOpRunInfoPtr &op_run_info);
  void RunOpFrontend(const FrontendOpRunInfoPtr &op_run_info);
  // If sub is true, this function will not convert StubTensor to Tensor.
  // Used to reduce the overhead of StubTensor WaitValue.
  FrontendOpRunInfoPtr GenerateOpRunInfo(const py::args &args, bool stub = false);
  ValuePtr RunSliceOpFrontend(const std::vector<ValuePtr> &input_values,
                              const std::vector<SliceOpInfoPtr> &slice_op_infos, bool requires_grad,
                              const stub::StubNodePtr &stub_output);
  void DispatchSilceOpFrontendTask(const std::vector<ValuePtr> &input_values,
                                   const std::vector<SliceOpInfoPtr> &slice_op_infos, bool requires_grad,
                                   const stub::StubNodePtr &stub_output);
  void set_grad_executor(const GradExecutorPtr &grad_executor) { grad_executor_ = GradExecutorWeakPtr(grad_executor); }
  void RefreshForwardCallback();
  void ClearNodeAbsMap() const;
  void SetNodeAbsMapByValue(const FrontendOpRunInfoPtr &op_run_info) const;
  void SetNodeAbsMapById(const std::string &id, const abstract::AbstractBasePtr &abs) const;
  AbstractBasePtr GetNodeAbsById(const std::string &id) const;
  void ClearRes();
  bool EnablePipeline(const std::string &op_name) const;
  bool enable_async() const;
  inline const std::string &device_target() const { return device_target_; }
  const MindrtBackendMap &mindrt_backend() const { return mindrt_backends_; }
  inline bool IsFirstCell() const { return forward_cell_stack_.empty(); }
  void PushForwardCell(const CellPtr &cell) { forward_cell_stack_.push(cell); }
  void PopForwardCell() { forward_cell_stack_.pop(); }
  void ExecuteLazyTask() const;
  void Sync();
  void PrintPyObjInfo(const py::object &obj, const std::string &str, bool is_cell) const;
  void ProcessBeforeNewGraph(const py::object &obj, const py::args &args);
  void ProcessAfterNewGraph(const py::object &obj) const;
  void ProcessBeforeEndGraph(const py::object &obj, bool is_cell);
  void ProcessAfterEndGraph(const py::object &obj, bool is_cell) const;
  bool CellNotSetMixedPrecision(const FrontendOpRunInfoPtr &op_run_info);
  inline InferOperationPtr infer_operation() const {
    MS_EXCEPTION_IF_NULL(infer_operation_);
    return infer_operation_;
  }
  inline void set_is_jit_compiling(bool is_jit_compiling) { is_jit_compiling_ = is_jit_compiling; }
  bool is_jit_compiling() const { return is_jit_compiling_; }

  void WaitForwardTask();
  bool IsVmOp(const std::string &op_name) const;
  std::string GetCurrentCellObjId() const;
  std::string GetCurrentDeviceTarget(const PrimitivePtr &op_prim) const;
  void ReInit();
  void ForwardOpGradImpl(const FrontendOpRunInfoPtr &op_run_info) const;
  GradExecutorPtr grad() const;
  void InitOpRunInfo(const FrontendOpRunInfoPtr &op_run_info);
  // Mix precision and Implicit transform
  void SetCastForInputs(const FrontendOpRunInfoPtr &op_run_info) const;
  inline const PyBoostCastOperationPtr &pyboost_cast_operation() const {
    MS_EXCEPTION_IF_NULL(pyboost_cast_operation_);
    return pyboost_cast_operation_;
  }
  void ChildAfterFork();

 private:
  compile::MindRTBackendPtr GetMindRtBackend(const string &cur_device_target);
  inline CastOperationPtr cast_operation() const {
    MS_EXCEPTION_IF_NULL(cast_operation_);
    return cast_operation_;
  }
  ValuePtr RunOpInVM(const FrontendOpRunInfoPtr &op_run_info) const;
  ValuePtr RunOpInMs(const FrontendOpRunInfoPtr &op_run_info, const BackendOpRunInfoPtr &backend_op_run_info);
  ValuePtr RunOpInMsInner(const FrontendOpRunInfoPtr &op_run_info, const BackendOpRunInfoPtr &backend_op_run_info);
  ValuePtr RunOpWithBackendPolicy(const FrontendOpRunInfoPtr &op_run_info,
                                  const BackendOpRunInfoPtr &backend_op_run_info);
  void RunOpBackend(const FrontendOpRunInfoPtr &op_run_info, const BackendOpRunInfoPtr &backend_op_run_info);
  void RunOpBackendSync(const FrontendOpRunInfoPtr &op_run_info);

  VectorRef RunOpBackendInner(const FrontendOpRunInfoPtr &op_run_info, const BackendOpRunInfoPtr &backend_op_run_info);
  // Infer output abstract
  void InferOutputAbstract(const FrontendOpRunInfoPtr &op_run_info) const;
  void PrepareOpInputs(const FrontendOpRunInfoPtr &op_run_info);
  void OpRunInfoUsePrimC(const FrontendOpRunInfoPtr &op_run_info) const;
  void CreateInputAddressForViewOp(const tensor::BaseTensorPtr &input_tensor, const FrontendOpRunInfoPtr &op_run_info);
  void DispatchViewKernelTask(const FrontendOpRunInfoPtr &op_run_info, const runtime::KernelTaskType &task_type);
  void ForwardRunViewKernelTask(const FrontendOpRunInfoPtr &op_run_info, const runtime::KernelTaskType &task_type,
                                bool enable_async);

  bool ProcessViewOp(const FrontendOpRunInfoPtr &op_run_info, const ops::StridesCalcFunc &func_info,
                     bool is_tuple_output);
  device::DeviceAddressPtr TensorContiguousCallback(const DeviceSyncPtr &device_address,
                                                    const TensorStorageInfoPtr &storage_info);

  void CreateViewOutputTensor(const FrontendOpRunInfoPtr &op_run_info, const tensor::BaseTensorPtr &input_tensor,
                              const TensorStorageInfoPtr &storage_info, runtime::KernelTaskType task_type);

  void DispatchAllocateMemTask(const FrontendOpRunInfoPtr &op_run_info, const tensor::TensorPtr &input_tensor,
                               const size_t &input_idx, bool need_wait = false);
  PrimitivePtr GetSlicePrimFromCache(const std::string &op_name);
  FrontendOpRunInfoPtr GenerateSliceOpRunInfo(const std::string &op_name, bool requires_grad,
                                              const stub::StubNodePtr &stub_output);
  void CreateViewOpOutputs(const FrontendOpRunInfoPtr &op_run_info, const tensor::BaseTensorPtr &view_input_tensor,
                           runtime::KernelTaskType task_type, const TensorStorageInfoPtrList &storage_infos,
                           bool is_tuple_output);

 private:
  bool init_{false};
  bool enable_async_{true};
  bool is_jit_compiling_{false};
  std::string device_target_;
  std::string last_target_{"Unknown"};
  std::stack<CellPtr> forward_cell_stack_;
  GradExecutorWeakPtr grad_executor_;
  CastOperationPtr cast_operation_;
  PyBoostCastOperationPtr pyboost_cast_operation_;
  InferOperationPtr infer_operation_;
  MindrtBackendMap mindrt_backends_;
  mindspore::HashMap<std::string, PrimitivePtr> slice_prim_cache_;
};
}  // namespace pynative
}  // namespace mindspore

#endif  // MINDSPORE_CCSRC_PIPELINE_PYNATIVE_FORWARD_FORWARD_H_