OpenHarmony-v4.1-Release/s

/*
 * Copyright (c) 2021-2024 Huawei Device Co., Ltd.
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 * http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

#ifndef COMPILER_OPTIMIZER_CODEGEN_TARGET_AARCH32_TARGET_H
#define COMPILER_OPTIMIZER_CODEGEN_TARGET_AARCH32_TARGET_H

#include "operands.h"
#include "encode.h"
#include "callconv.h"
#include "target_info.h"

#ifdef USE_VIXL_ARM32
#include "aarch32/constants-aarch32.h"
#include "aarch32/instructions-aarch32.h"
#include "aarch32/macro-assembler-aarch32.h"
#else
#error "Wrong build type, please add VIXL in build"
#endif  // USE_VIXL_ARM32

namespace panda::compiler::aarch32 {
constexpr uint32_t AVAILABLE_DOUBLE_WORD_REGISTERS = 4;

static inline constexpr const uint8_t UNDEF_REG = std::numeric_limits<uint8_t>::max();

const size_t AARCH32_COUNT_REG = 3;
const size_t AARCH32_COUNT_VREG = 2;

const size_t MAX_SCALAR_PARAM_ID = 3;          // r0-r3
const size_t MAX_VECTOR_SINGLE_PARAM_ID = 15;  // s0-s15
const size_t MAX_VECTOR_DOUBLE_PARAM_ID = 7;   // d0-d7

// Temporary registers used (r12 already used by vixl)
// r11 is used as FP register for frames
const std::array<unsigned, AARCH32_COUNT_REG> AARCH32_TMP_REG = {
    vixl::aarch32::r8.GetCode(), vixl::aarch32::r9.GetCode(), vixl::aarch32::r12.GetCode()};

// Temporary vector registers used
const std::array<unsigned, AARCH32_COUNT_VREG> AARCH32_TMP_VREG = {vixl::aarch32::s14.GetCode(),
                                                                   vixl::aarch32::s15.GetCode()};

static inline bool IsConditionSigned(Condition cc)
{
    switch (cc) {
        case Condition::LT:
        case Condition::LE:
        case Condition::GT:
        case Condition::GE:
            return true;

        default:
            return false;
    }
}

/// Converters
static inline vixl::aarch32::Condition Convert(const Condition cc)
{
    switch (cc) {
        case Condition::EQ:
            return vixl::aarch32::eq;
        case Condition::NE:
            return vixl::aarch32::ne;
        case Condition::LT:
            return vixl::aarch32::lt;
        case Condition::GT:
            return vixl::aarch32::gt;
        case Condition::LE:
            return vixl::aarch32::le;
        case Condition::GE:
            return vixl::aarch32::ge;
        case Condition::LO:
            return vixl::aarch32::lo;
        case Condition::LS:
            return vixl::aarch32::ls;
        case Condition::HI:
            return vixl::aarch32::hi;
        case Condition::HS:
            return vixl::aarch32::hs;
        // NOTE(igorban) : Remove them
        case Condition::MI:
            return vixl::aarch32::mi;
        case Condition::PL:
            return vixl::aarch32::pl;
        case Condition::VS:
            return vixl::aarch32::vs;
        case Condition::VC:
            return vixl::aarch32::vc;
        case Condition::AL:
            return vixl::aarch32::al;
        default:
            UNREACHABLE();
            return vixl::aarch32::eq;
    }
}

/// Converters
static inline vixl::aarch32::Condition ConvertTest(const Condition cc)
{
    ASSERT(cc == Condition::TST_EQ || cc == Condition::TST_NE);
    return cc == Condition::TST_EQ ? vixl::aarch32::eq : vixl::aarch32::ne;
}

static inline vixl::aarch32::Register VixlReg(Reg reg)
{
    ASSERT(reg.IsValid());
    if (reg.IsScalar()) {
        auto vixlReg = vixl::aarch32::Register(reg.GetId());
        ASSERT(vixlReg.IsValid());
        return vixlReg;
    }
    // Unsupported register type
    UNREACHABLE();
    return vixl::aarch32::Register();
}

// Upper half-part for register
static inline vixl::aarch32::Register VixlRegU(Reg reg)
{
    ASSERT(reg.IsValid());
    if (reg.IsScalar()) {
        auto vixlReg = vixl::aarch32::Register(reg.GetId() + 1);
        ASSERT(reg.GetId() <= AVAILABLE_DOUBLE_WORD_REGISTERS * 2U);
        ASSERT(vixlReg.IsValid());
        return vixlReg;
    }
    // Unsupported register type
    UNREACHABLE();
    return vixl::aarch32::Register();
}

static inline vixl::aarch32::VRegister VixlVReg(Reg reg)
{
    ASSERT(reg.IsValid());
    ASSERT(reg.IsFloat());
    if (reg.GetSize() == WORD_SIZE) {
        // Aarch32 Vreg map double regs for 2 single-word registers
        auto vixlVreg = vixl::aarch32::SRegister(reg.GetId());
        ASSERT(vixlVreg.IsValid());
        return vixlVreg;
    }
    ASSERT(reg.GetSize() == DOUBLE_WORD_SIZE);
    ASSERT(reg.GetId() % 2U == 0);
    auto vixlVreg = vixl::aarch32::DRegister(reg.GetId() / 2U);
    ASSERT(vixlVreg.IsValid());
    return vixlVreg;
}

static inline vixl::aarch32::Operand VixlImm(const int32_t imm)
{
    return vixl::aarch32::Operand(imm);
}

static inline vixl::aarch32::NeonImmediate VixlNeonImm(const float imm)
{
    return vixl::aarch32::NeonImmediate(imm);
}

static inline vixl::aarch32::NeonImmediate VixlNeonImm(const double imm)
{
    return vixl::aarch32::NeonImmediate(imm);
}

static inline vixl::aarch32::DataType Convert(const TypeInfo info, const bool isSigned = false)
{
    if (!isSigned) {
        if (info.IsFloat()) {
            if (info.GetSize() == WORD_SIZE) {
                return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::F32);
            }
            ASSERT(info.GetSize() == DOUBLE_WORD_SIZE);
            return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::F64);
        }
        switch (info.GetSize()) {
            case BYTE_SIZE:
                return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::I8);
            case HALF_SIZE:
                return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::I16);
            case WORD_SIZE:
                return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::I32);
            case DOUBLE_WORD_SIZE:
                return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::I64);
            default:
                break;
        }
    }
    ASSERT(!info.IsFloat());

    switch (info.GetSize()) {
        case BYTE_SIZE:
            return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::S8);
        case HALF_SIZE:
            return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::S16);
        case WORD_SIZE:
            return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::S32);
        case DOUBLE_WORD_SIZE:
            return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::S64);
        default:
            break;
    }
    return vixl::aarch32::DataType(vixl::aarch32::DataTypeValue::kDataTypeValueInvalid);
}

static inline vixl::aarch32::Operand VixlImm(Imm imm)
{
    // Unsupported 64-bit values - force cast
    return vixl::aarch32::Operand(static_cast<int32_t>(imm.GetRawValue()));
}

// Upper half for immediate
static inline vixl::aarch32::Operand VixlImmU(Imm imm)
{
    // Unsupported 64-bit values - force cast
    // NOLINTNEXTLINE(hicpp-signed-bitwise)
    auto data = static_cast<int32_t>(imm.GetRawValue() >> WORD_SIZE);
    return vixl::aarch32::Operand(data);
}

class Aarch32RegisterDescription final : public RegistersDescription {
    //                 r4-r10 - "0000011111110000"
    // NOLINTNEXTLINE(readability-identifier-naming)
    const RegMask CALLEE_SAVED = RegMask(GetCalleeRegsMask(Arch::AARCH32, false));
    //                 s16-s31 - "11111111111111110000000000000000"
    // NOLINTNEXTLINE(readability-identifier-naming)
    const VRegMask CALLEE_SAVEDV = VRegMask(GetCalleeRegsMask(Arch::AARCH32, true));
    //                 r0-r3 -  "0000000000001111"
    // NOLINTNEXTLINE(readability-identifier-naming)
    const RegMask CALLER_SAVED = RegMask(GetCallerRegsMask(Arch::AARCH32, false));
    //                 s0-s15 - "00000000000000001111111111111111"
    // NOLINTNEXTLINE(readability-identifier-naming)
    const VRegMask CALLER_SAVEDV = VRegMask(GetCallerRegsMask(Arch::AARCH32, true));

public:
    explicit Aarch32RegisterDescription(ArenaAllocator *allocator);
    NO_MOVE_SEMANTIC(Aarch32RegisterDescription);
    NO_COPY_SEMANTIC(Aarch32RegisterDescription);
    ~Aarch32RegisterDescription() override = default;

    ArenaVector<Reg> GetCalleeSaved() override;
    void SetCalleeSaved(const ArenaVector<Reg> &regs) override;

    // Set used regs - change GetCallee
    void SetUsedRegs(const ArenaVector<Reg> &regs) override;

    RegMask GetCallerSavedRegMask() const override
    {
        return callerSaved_;
    }

    VRegMask GetCallerSavedVRegMask() const override
    {
        return callerSavedv_;
    }

    bool IsCalleeRegister(Reg reg) override
    {
        bool isFp = reg.IsFloat();
        return reg.GetId() >= GetFirstCalleeReg(Arch::AARCH32, isFp) &&
               reg.GetId() <= GetLastCalleeReg(Arch::AARCH32, isFp);
    }

    Reg GetZeroReg() const override
    {
        return INVALID_REGISTER;
    }

    bool IsZeroReg([[maybe_unused]] Reg reg) const override
    {
        return false;
    }

    Reg::RegIDType GetTempReg() override
    {
        return INVALID_REG_ID;
    }

    Reg::RegIDType GetTempVReg() override
    {
        return INVALID_REG_ID;
    }

    // Reg Mask
    // r0,r1,r2,r3,r4,r5,r6,r7,r8,r9,r10,r11,r12,r13,r14,r15
    // -dwr0,-dwr1,-dwr2,-dwr3,-dwr4,---dwr8,---dwr6,---dwr7 <- double word
    // r0,r1,r2,r3,r4,r5,r6,r7,r8,r9, fp+tmp,  sp+ip, lr+pc
    // |----------------------------| <- available for regalloc
    // r0,   r2,   r4,   r6    r8    - market to be available
    RegMask GetDefaultRegMask() const override
    {
        // Set all to 1
        RegMask regMask;
        regMask.set();
        for (size_t i = 0; i < AVAILABLE_DOUBLE_WORD_REGISTERS; ++i) {
            regMask.reset(i * 2U);
        }
        regMask.set(GetThreadReg(Arch::AARCH32));
        return regMask;
    }

    VRegMask GetVRegMask() override
    {
        VRegMask vregMask;
        for (auto vregCode : AARCH32_TMP_VREG) {
            vregMask.set(vregCode);
        }
        // Only d0-d15 available for alloc
        // They mapped on s0-s31 same, like scalar:
        for (size_t i = 0; i < vregMask.size() / 2U; ++i) {
            vregMask.set(i * 2U + 1);
        }
        return vregMask;
    }

    bool SupportMapping(uint32_t type) override
    {
        // Current implementation does not support vreg-vreg mapping
        if ((type & (RegMapping::VECTOR_VECTOR | RegMapping::FLOAT_FLOAT)) != 0U) {
            return false;
        }
        // Scalar and float registers lay in different registers
        if ((type & (RegMapping::SCALAR_VECTOR | RegMapping::SCALAR_FLOAT)) != 0U) {
            return false;
        }
        // Supported mapping for upper half register-parts:
        // (type & RegMapping::SCALAR_SCALAR != 0)
        return true;
    };

    bool IsValid() const override;

    bool IsRegUsed(ArenaVector<Reg> vecReg, Reg reg) override;

    // NOTE(igorban): implement as virtual
    static bool IsTmp(Reg reg);

public:
    // Special implementation-specific getters
    RegMask GetCalleeSavedR()
    {
        return calleeSaved_;
    }
    VRegMask GetCalleeSavedV()
    {
        return calleeSavedv_;
    }
    RegMask GetCallerSavedR()
    {
        return callerSaved_;
    }
    VRegMask GetCallerSavedV()
    {
        return callerSavedv_;
    }

    uint8_t GetAligmentReg(bool isCallee)
    {
        auto allignmentReg = isCallee ? allignmentRegCallee_ : allignmentRegCaller_;
        ASSERT(allignmentReg != UNDEF_REG);
        return allignmentReg;
    }

private:
    // Full list of arm64 General-purpose registers (with vector registers)
    ArenaVector<Reg> aarch32RegList_;
    //
    ArenaVector<Reg> usedRegs_;
    Reg tmpReg1_;
    Reg tmpReg2_;

    RegMask calleeSaved_ {CALLEE_SAVED};
    RegMask callerSaved_ {CALLER_SAVED};

    VRegMask calleeSavedv_ {CALLEE_SAVEDV};
    VRegMask callerSavedv_ {CALLER_SAVEDV};

    uint8_t allignmentRegCallee_ {UNDEF_REG};
    uint8_t allignmentRegCaller_ {UNDEF_REG};
};  // Aarch32RegisterDescription

class Aarch32Encoder;

class Aarch32LabelHolder final : public LabelHolder {
public:
    using LabelType = vixl::aarch32::Label;
    explicit Aarch32LabelHolder(Encoder *enc) : LabelHolder(enc), labels_(enc->GetAllocator()->Adapter()) {};

    LabelId CreateLabel() override
    {
        ++id_;
        auto allocator = GetEncoder()->GetAllocator();
        auto *label = allocator->New<LabelType>(allocator);
        labels_.push_back(label);
        ASSERT(labels_.size() == id_);
        return id_ - 1;
    };

    void CreateLabels(LabelId size) override
    {
        for (LabelId i = 0; i <= size; ++i) {
            CreateLabel();
        }
    };

    void BindLabel(LabelId id) override;

    LabelType *GetLabel(LabelId id)
    {
        ASSERT(labels_.size() > id);
        return labels_[id];
    }

    LabelId Size() override
    {
        return labels_.size();
    };

    NO_MOVE_SEMANTIC(Aarch32LabelHolder);
    NO_COPY_SEMANTIC(Aarch32LabelHolder);
    ~Aarch32LabelHolder() override = default;

private:
    ArenaVector<LabelType *> labels_;
    LabelId id_ {0};
    friend Aarch32Encoder;
};  // Aarch32LabelHolder

class Aarch32Encoder final : public Encoder {
public:
    explicit Aarch32Encoder(ArenaAllocator *allocator);

    LabelHolder *GetLabels() const override
    {
        return labels_;
    };

    ~Aarch32Encoder() override;

    NO_COPY_SEMANTIC(Aarch32Encoder);
    NO_MOVE_SEMANTIC(Aarch32Encoder);

    bool IsValid() const override
    {
        return true;
    }

    static constexpr auto GetTarget()
    {
        return panda::compiler::Target(Arch::AARCH32);
    }

    void SetMaxAllocatedBytes(size_t size) override
    {
        GetMasm()->GetBuffer()->SetMmapMaxBytes(size);
    }

// NOLINTNEXTLINE(cppcoreguidelines-macro-usage)
#define UNARY_OPERATION(opc) void Encode##opc(Reg dst, Reg src0) override;
// NOLINTNEXTLINE(cppcoreguidelines-macro-usage)
#define BINARY_OPERATION_REG_REG_REG(opc) void Encode##opc(Reg dst, Reg src0, Reg src1) override;
// NOLINTNEXTLINE(cppcoreguidelines-macro-usage)
#define BINARY_OPERATION_REG_REG_IMM(opc) void Encode##opc(Reg dst, Reg src0, Imm src1) override;
// NOLINTNEXTLINE(cppcoreguidelines-macro-usage)
#define BINARY_OPERATION(opc) BINARY_OPERATION_REG_REG_REG(opc) BINARY_OPERATION_REG_REG_IMM(opc)
// NOLINTNEXTLINE(cppcoreguidelines-macro-usage)
#define INST_DEF(OPCODE, TYPE) TYPE(OPCODE)

    ENCODE_MATH_LIST(INST_DEF)

#undef UNARY_OPERATION
#undef BINARY_OPERATION
#undef INST_DEF

    void EncodeNop() override;

    // Additional special instructions
    void EncodeCastToBool(Reg dst, Reg src) override;
    void EncodeCast(Reg dst, bool dstSigned, Reg src, bool srcSigned) override;
    void EncodeMin(Reg dst, bool dstSigned, Reg src0, Reg src1) override;
    void EncodeDiv(Reg dst, bool dstSigned, Reg src0, Reg src1) override;
    void EncodeMod(Reg dst, bool dstSigned, Reg src0, Reg src1) override;
    void EncodeMax(Reg dst, bool dstSigned, Reg src0, Reg src1) override;

    void EncodeLdr(Reg dst, bool dstSigned, MemRef mem) override;
    void EncodeLdr(Reg dst, bool dstSigned, const vixl::aarch32::MemOperand &vixlMem);
    void EncodeLdrAcquire(Reg dst, bool dstSigned, MemRef mem) override;

    void EncodeMemoryBarrier(memory_order::Order order) override;

    void EncodeMov(Reg dst, Imm src) override;
    void EncodeStr(Reg src, const vixl::aarch32::MemOperand &vixlMem);
    void EncodeStr(Reg src, MemRef mem) override;
    void EncodeStrRelease(Reg src, MemRef mem) override;
    void EncodeStp(Reg src0, Reg src1, MemRef mem) override;

    /* builtins-related encoders */
    void EncodeIsInf(Reg dst, Reg src) override;
    void EncodeIsInteger(Reg dst, Reg src) override;
    void EncodeIsSafeInteger(Reg dst, Reg src) override;
    void EncodeBitCount(Reg dst, Reg src) override;
    void EncodeCountLeadingZeroBits(Reg dst, Reg src) override;
    void EncodeCeil([[maybe_unused]] Reg dst, [[maybe_unused]] Reg src) override;
    void EncodeFloor([[maybe_unused]] Reg dst, [[maybe_unused]] Reg src) override;
    void EncodeRint([[maybe_unused]] Reg dst, [[maybe_unused]] Reg src) override;
    void EncodeTrunc([[maybe_unused]] Reg dst, [[maybe_unused]] Reg src) override;
    void EncodeRoundAway([[maybe_unused]] Reg dst, [[maybe_unused]] Reg src) override;
    void EncodeRoundToPInf([[maybe_unused]] Reg dst, [[maybe_unused]] Reg src) override;
    void EncodeReverseBytes(Reg dst, Reg src) override;
    void EncodeReverseBits(Reg dst, Reg src) override;
    void EncodeFpToBits(Reg dst, Reg src) override;
    void EncodeMoveBitsRaw(Reg dst, Reg src) override;

    void EncodeLdrExclusive(Reg dst, Reg addr, bool acquire) override;
    void EncodeStrExclusive(Reg dst, Reg src, Reg addr, bool release) override;

    // zerod high part: [reg.size, 64)
    void EncodeStrz(Reg src, MemRef mem) override;
    void EncodeSti(int64_t src, uint8_t srcSizeBytes, MemRef mem) override;
    void EncodeSti(double src, MemRef mem) override;
    void EncodeSti(float src, MemRef mem) override;
    // size must be 8, 16,32 or 64
    void EncodeMemCopy(MemRef memFrom, MemRef memTo, size_t size) override;
    // size must be 8, 16,32 or 64
    // zerod high part: [reg.size, 64)
    void EncodeMemCopyz(MemRef memFrom, MemRef memTo, size_t size) override;

    void EncodeCmp(Reg dst, Reg src0, Reg src1, Condition cc) override;

    void EncodeCompare(Reg dst, Reg src0, Reg src1, Condition cc) override;
    void EncodeCompareTest(Reg dst, Reg src0, Reg src1, Condition cc) override;

    void EncodeSelect(Reg dst, Reg src0, Reg src1, Reg src2, Reg src3, Condition cc) override;
    void EncodeSelect(Reg dst, Reg src0, Reg src1, Reg src2, Imm imm, Condition cc) override;
    void EncodeSelectTest(Reg dst, Reg src0, Reg src1, Reg src2, Reg src3, Condition cc) override;
    void EncodeSelectTest(Reg dst, Reg src0, Reg src1, Reg src2, Imm imm, Condition cc) override;

    bool CanEncodeImmAddSubCmp(int64_t imm, uint32_t size, bool signedCompare) override;
    bool CanEncodeImmLogical(uint64_t imm, uint32_t size) override;

    size_t GetCursorOffset() const override
    {
        return GetMasm()->GetBuffer()->GetCursorOffset();
    }

    void SetCursorOffset(size_t offset) override
    {
        GetMasm()->GetBuffer()->Rewind(offset);
    }

    Reg AcquireScratchRegister(TypeInfo type) override
    {
        ASSERT(GetMasm()->GetCurrentScratchRegisterScope() == nullptr);
        if (type.IsFloat()) {
            if (type == FLOAT32_TYPE) {
                auto reg = GetMasm()->GetScratchVRegisterList()->GetFirstAvailableSRegister();
                ASSERT(reg.IsValid());
                GetMasm()->GetScratchVRegisterList()->Remove(reg);
                return Reg(reg.GetCode(), type);
            }
            // Get 2 float registers instead one double - to save agreement about hi-regs in VixlVReg
            auto reg1 = GetMasm()->GetScratchVRegisterList()->GetFirstAvailableSRegister();
            auto reg2 = GetMasm()->GetScratchVRegisterList()->GetFirstAvailableSRegister();
            ASSERT(reg1.IsValid());
            ASSERT(reg2.IsValid());
            GetMasm()->GetScratchVRegisterList()->Remove(reg1);
            GetMasm()->GetScratchVRegisterList()->Remove(reg2);
            return Reg(reg1.GetCode(), type);
        }
        auto reg = GetMasm()->GetScratchRegisterList()->GetFirstAvailableRegister();
        ASSERT(reg.IsValid());
        GetMasm()->GetScratchRegisterList()->Remove(reg);
        return Reg(reg.GetCode(), type);
    }

    void AcquireScratchRegister(Reg reg) override
    {
        if (reg == GetTarget().GetLinkReg()) {
            ASSERT_PRINT(!lrAcquired_, "Trying to acquire LR, which hasn't been released before");
            lrAcquired_ = true;
        } else if (reg.IsFloat()) {
            ASSERT(GetMasm()->GetScratchVRegisterList()->IncludesAliasOf(vixl::aarch32::SRegister(reg.GetId())));
            GetMasm()->GetScratchVRegisterList()->Remove(vixl::aarch32::SRegister(reg.GetId()));
        } else {
            ASSERT(GetMasm()->GetScratchRegisterList()->Includes(vixl::aarch32::Register(reg.GetId())));
            GetMasm()->GetScratchRegisterList()->Remove(vixl::aarch32::Register(reg.GetId()));
        }
    }

    void ReleaseScratchRegister(Reg reg) override
    {
        if (reg == GetTarget().GetLinkReg()) {
            ASSERT_PRINT(lrAcquired_, "Trying to release LR, which hasn't been acquired before");
            lrAcquired_ = false;
        } else if (reg.IsFloat()) {
            GetMasm()->GetScratchVRegisterList()->Combine(vixl::aarch32::SRegister(reg.GetId()));
        } else {
            GetMasm()->GetScratchRegisterList()->Combine(vixl::aarch32::Register(reg.GetId()));
        }
    }

    bool IsScratchRegisterReleased(Reg reg) override
    {
        if (reg == GetTarget().GetLinkReg()) {
            return !lrAcquired_;
        }
        if (reg.IsFloat()) {
            return GetMasm()->GetScratchVRegisterList()->IncludesAliasOf(vixl::aarch32::SRegister(reg.GetId()));
        }
        return GetMasm()->GetScratchRegisterList()->Includes(vixl::aarch32::Register(reg.GetId()));
    }

    RegMask GetScratchRegistersMask() const override
    {
        return RegMask(GetMasm()->GetScratchRegisterList()->GetList());
    }

    RegMask GetScratchFpRegistersMask() const override
    {
        return RegMask(GetMasm()->GetScratchVRegisterList()->GetList());
    }

    RegMask GetAvailableScratchRegisters() const override
    {
        return RegMask(GetMasm()->GetScratchRegisterList()->GetList());
    }

    VRegMask GetAvailableScratchFpRegisters() const override
    {
        return VRegMask(GetMasm()->GetScratchVRegisterList()->GetList());
    }

    void SetRegister(RegMask *mask, VRegMask *vmask, Reg reg, bool val) const override
    {
        if (!reg.IsValid()) {
            return;
        }
        if (reg.IsScalar()) {
            ASSERT(mask != nullptr);
            mask->set(reg.GetId(), val);
            if (reg.GetSize() > WORD_SIZE) {
                mask->set(reg.GetId() + 1, val);
            }
        } else {
            ASSERT(vmask != nullptr);
            ASSERT(reg.IsFloat());
            vmask->set(reg.GetId(), val);
            if (reg.GetSize() > WORD_SIZE) {
                vmask->set(reg.GetId() + 1, val);
            }
        }
    }

    TypeInfo GetRefType() override
    {
        return INT32_TYPE;
    };

    size_t DisasmInstr(std::ostream &stream, size_t pc, ssize_t codeOffset) const override;

    void *BufferData() const override
    {
        return GetMasm()->GetBuffer()->GetStartAddress<void *>();
    };

    size_t BufferSize() const override
    {
        return GetMasm()->GetBuffer()->GetSizeInBytes();
    };

    bool InitMasm() override;

    void Finalize() override;

    void MakeCall(compiler::RelocationInfo *relocation) override;
    void MakeCall(const void *entryPoint) override;
    void MakeCall(MemRef entryPoint) override;
    void MakeCall(Reg reg) override;

    void MakeCallAot(intptr_t offset) override;
    void MakeCallByOffset(intptr_t offset) override;
    void MakeLoadAotTable(intptr_t offset, Reg reg) override;
    void MakeLoadAotTableAddr(intptr_t offset, Reg addr, Reg val) override;

    // Encode unconditional branch
    void EncodeJump(LabelHolder::LabelId id) override;

    // Encode jump with compare to zero
    void EncodeJump(LabelHolder::LabelId id, Reg src, Condition cc) override;

    // Compare reg and immediate and branch
    void EncodeJump(LabelHolder::LabelId id, Reg src, Imm imm, Condition cc) override;

    // Compare two regs and branch
    void EncodeJump(LabelHolder::LabelId id, Reg src0, Reg src1, Condition cc) override;

    // Compare reg and immediate and branch
    void EncodeJumpTest(LabelHolder::LabelId id, Reg src, Imm imm, Condition cc) override;

    // Compare two regs and branch
    void EncodeJumpTest(LabelHolder::LabelId id, Reg src0, Reg src1, Condition cc) override;

    // Encode jump by register value
    void EncodeJump(Reg dst) override;

    void EncodeJump(RelocationInfo *relocation) override;

    void EncodeBitTestAndBranch(LabelHolder::LabelId id, compiler::Reg reg, uint32_t bitPos, bool bitValue) override;

    void EncodeAbort() override;

    void EncodeReturn() override;

    void EncodeStackOverflowCheck(ssize_t offset) override;

    void SaveRegisters(RegMask registers, ssize_t slot, size_t startReg, bool isFp) override
    {
        LoadStoreRegisters<true>(registers, slot, startReg, isFp);
    }
    void LoadRegisters(RegMask registers, ssize_t slot, size_t startReg, bool isFp) override
    {
        LoadStoreRegisters<false>(registers, slot, startReg, isFp);
    }

    void SaveRegisters(RegMask registers, bool isFp, ssize_t slot, Reg base, RegMask mask) override
    {
        LoadStoreRegisters<true>(registers, isFp, slot, base, mask);
    }
    void LoadRegisters(RegMask registers, bool isFp, ssize_t slot, Reg base, RegMask mask) override
    {
        LoadStoreRegisters<false>(registers, isFp, slot, base, mask);
    }

    void PushRegisters(RegMask registers, bool isFp) override;
    void PopRegisters(RegMask registers, bool isFp) override;

    static inline vixl::aarch32::MemOperand ConvertMem(MemRef mem)
    {
        bool hasIndex = mem.HasIndex();
        bool hasShift = mem.HasScale();
        bool hasOffset = mem.HasDisp();
        auto baseReg = VixlReg(mem.GetBase());
        if (hasIndex) {
            // MemRef with index and offser isn't supported
            ASSERT(!hasOffset);
            auto indexReg = mem.GetIndex();
            if (hasShift) {
                auto shift = mem.GetScale();
                return vixl::aarch32::MemOperand(baseReg, VixlReg(indexReg), vixl::aarch32::LSL, shift);
            }
            return vixl::aarch32::MemOperand(baseReg, VixlReg(indexReg));
        }
        if (hasOffset) {
            auto offset = mem.GetDisp();
            return vixl::aarch32::MemOperand(baseReg, offset);
        }
        return vixl::aarch32::MemOperand(baseReg);
    }

    /**
     * The function construct additional instruction for encode memory instructions and returns MemOperand for ldr/str
     * LDR/STR with immediate offset(for A32)
     * |  mem type  | offset size |
     * | ---------- | ----------- |
     * |word or byte|-4095 to 4095|
     * |   others   | -255 to 255 |
     *
     * LDR/STR with register offset(for A32)
     * |  mem type  |    shift    |
     * | ---------- | ----------- |
     * |word or byte|    0 to 31  |
     * |   others   |      --     |
     *
     * VLDR and VSTR has base and offset. The offset must be a multiple of 4, and lie in the range -1020 to +1020.
     */
    static bool IsNeedToPrepareMemLdS(MemRef mem, const TypeInfo &memType, bool isSigned);
    vixl::aarch32::MemOperand PrepareMemLdS(MemRef mem, const TypeInfo &memType, vixl::aarch32::Register tmp,
                                            bool isSigned, bool copySp = false);

    void MakeLibCall(Reg dst, Reg src0, Reg src1, void *entryPoint, bool secondValue = false);

    void MakeLibCall(Reg dst, Reg src, void *entryPoint);

    vixl::aarch32::MacroAssembler *GetMasm() const
    {
        ASSERT(masm_ != nullptr);
        return masm_;
    }

    size_t GetLabelAddress(LabelHolder::LabelId label) override
    {
        auto plabel = labels_->GetLabel(label);
        ASSERT(plabel->IsBound());
        return GetMasm()->GetBuffer()->GetOffsetAddress<size_t>(plabel->GetLocation());
    }

    bool LabelHasLinks(LabelHolder::LabelId label) override
    {
        auto plabel = labels_->GetLabel(label);
        return plabel->IsReferenced();
    }

private:
    template <bool IS_STORE>
    void LoadStoreRegisters(RegMask registers, ssize_t slot, size_t startReg, bool isFp);

    template <bool IS_STORE>
    void LoadStoreRegisters(RegMask registers, bool isFp, int32_t slot, Reg base, RegMask mask);

    template <bool IS_STORE>
    void LoadStoreRegistersMainLoop(RegMask registers, bool isFp, int32_t slot, Reg base, RegMask mask);

private:
    vixl::aarch32::MemOperand PrepareMemLdSForFloat(MemRef mem, vixl::aarch32::Register tmp);
    void EncodeCastFloatToFloat(Reg dst, Reg src);
    void EncodeCastFloatToInt64(Reg dst, Reg src);
    void EncodeCastDoubleToInt64(Reg dst, Reg src);
    void EncodeCastScalarToFloat(Reg dst, Reg src, bool srcSigned);
    void EncodeCastFloatToScalar(Reg dst, bool dstSigned, Reg src);
    void EncodeCastFloatToScalarWithSmallDst(Reg dst, bool dstSigned, Reg src);

    void EncoderCastExtendFromInt32(Reg dst, bool dstSigned);
    void EncodeCastScalar(Reg dst, bool dstSigned, Reg src, bool srcSigned);
    void EncodeCastScalarFromSignedScalar(Reg dst, Reg src);
    void EncodeCastScalarFromUnsignedScalar(Reg dst, Reg src);
    template <bool IS_MAX>
    void EncodeMinMaxFp(Reg dst, Reg src0, Reg src1);
    void EncodeVorr(Reg dst, Reg src0, Reg src1);
    void EncodeVand(Reg dst, Reg src0, Reg src1);
    void MakeLibCallWithFloatResult(Reg dst, Reg src0, Reg src1, void *entryPoint, bool secondValue);
    void MakeLibCallWithDoubleResult(Reg dst, Reg src0, Reg src1, void *entryPoint, bool secondValue);
    void MakeLibCallWithInt64Result(Reg dst, Reg src0, Reg src1, void *entryPoint, bool secondValue);
    void CompareHelper(Reg src0, Reg src1, Condition *cc);
    void TestHelper(Reg src0, Reg src1, Condition cc);
    bool CompareImmHelper(Reg src, int64_t imm, Condition *cc);
    void TestImmHelper(Reg src, Imm imm, Condition cc);
    bool CompareNegImmHelper(Reg src, int64_t value, const Condition *cc);
    bool ComparePosImmHelper(Reg src, int64_t value, Condition *cc);
    void CompareZeroHelper(Reg src, Condition *cc);
    void EncodeCmpFracWithDelta(Reg src);
    static inline constexpr int32_t MEM_BIG_OFFSET = 4095;
    static inline constexpr int32_t MEM_SMALL_OFFSET = 255;
    static inline constexpr int32_t VMEM_OFFSET = 1020;
    Aarch32LabelHolder *labels_ {nullptr};
    vixl::aarch32::MacroAssembler *masm_ {nullptr};
    bool lrAcquired_ {false};
};  // Aarch32Encoder

class Aarch32ParameterInfo final : public ParameterInfo {
public:
    std::variant<Reg, uint8_t> GetNativeParam(const TypeInfo &type) override;
    Location GetNextLocation(DataType::Type type) override;
};

class Aarch32CallingConvention : public CallingConvention {
public:
    Aarch32CallingConvention(ArenaAllocator *allocator, Encoder *enc, RegistersDescription *descr, CallConvMode mode);

    static constexpr auto GetTarget()
    {
        return panda::compiler::Target(Arch::AARCH32);
    }

    bool IsValid() const override
    {
        return true;
    }

    void GeneratePrologue(const FrameInfo &frameInfo) override;
    void GenerateEpilogue(const FrameInfo &frameInfo, std::function<void()> postJob) override;
    void GenerateNativePrologue(const FrameInfo &frameInfo) override
    {
        GeneratePrologue(frameInfo);
    }
    void GenerateNativeEpilogue(const FrameInfo &frameInfo, std::function<void()> postJob) override
    {
        GenerateEpilogue(frameInfo, postJob);
    }

    void *GetCodeEntry() override;
    uint32_t GetCodeSize() override;

    vixl::aarch32::MacroAssembler *GetMasm()
    {
        return (static_cast<Aarch32Encoder *>(GetEncoder()))->GetMasm();
    }

    // Calculating information about parameters and save regs_offset registers for special needs
    ParameterInfo *GetParameterInfo(uint8_t regsOffset) override;

    NO_MOVE_SEMANTIC(Aarch32CallingConvention);
    NO_COPY_SEMANTIC(Aarch32CallingConvention);
    ~Aarch32CallingConvention() override = default;

private:
    uint8_t PushPopVRegs(VRegMask vregs, bool isPush);
    uint8_t PushRegs(RegMask regs, VRegMask vregs, bool isCallee);
    uint8_t PopRegs(RegMask regs, VRegMask vregs, bool isCallee);
};  // Aarch32CallingConvention
}  // namespace panda::compiler::aarch32

#endif  // COMPILER_OPTIMIZER_CODEGEN_TARGET_AARCH32_TARGET_H