/* * Copyright (C) 2019 The Android Open Source Project * * Licensed under the Apache License, Version 2.0 (the "License"); * you may not use this file except in compliance with the License. * You may obtain a copy of the License at * * http://www.apache.org/licenses/LICENSE-2.0 * * Unless required by applicable law or agreed to in writing, software * distributed under the License is distributed on an "AS IS" BASIS, * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. * See the License for the specific language governing permissions and * limitations under the License. */ #include "gtest/gtest.h" #include #include #include #include "utility.h" namespace { TEST(Arm64InsnTest, UnsignedBitfieldMoveNoShift) { uint64_t arg = 0x3952247371907021ULL; uint64_t res; asm("ubfm %0, %1, #0, #63" : "=r"(res) : "r"(arg)); ASSERT_EQ(res, 0x3952247371907021ULL); } TEST(Arm64InsnTest, BitfieldLeftInsertion) { uint64_t arg = 0x389522868478abcdULL; uint64_t res = 0x1101044682325271ULL; asm("bfm %0, %1, #40, #15" : "=r"(res) : "r"(arg), "0"(res)); ASSERT_EQ(res, 0x110104abcd325271ULL); } TEST(Arm64InsnTest, BitfieldRightInsertion) { uint64_t arg = 0x3276561809377344ULL; uint64_t res = 0x1668039626579787ULL; asm("bfm %0, %1, #4, #39" : "=r"(res) : "r"(arg), "0"(res)); ASSERT_EQ(res, 0x1668039180937734ULL); } TEST(Arm64InsnTest, MoveImmToFp32) { // The tests below verify that fmov works with various immediates. // Specifically, the instruction has an 8-bit immediate field consisting of // the following four subfields: // // - sign (one bit) // - upper exponent (one bit) // - lower exponent (two bits) // - mantisa (four bits) // // For example, we decompose imm8 = 0b01001111 into: // // - sign = 0 (positive) // - upper exponent = 1 // - lower exponent = 00 // - mantisa = 1111 // // This immediate corresponds to 32-bit floating point value: // // 0 011111 00 1111 0000000000000000000 // | | | | | // | | | | +- 19 zeros // | | | +------ mantisa // | | +--------- lower exponent // | +---------------- upper exponent (custom extended to 6 bits) // +------------------ sign // // Thus we have: // // 1.11110000... * 2^(124-127) = 0.2421875 // // where 1.11110000... is in binary. // // See VFPExpandImm in the ARM Architecture Manual for details. // // We enumerate all possible 8-bit immediate encodings of the form: // // {0,1}{0,1}{00,11}{0000,1111} // // to verify that the decoder correctly splits the immediate into the // subfields and reconstructs the intended floating-point value. // imm8 = 0b00000000 __uint128_t res1 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #2.0e+00")(); ASSERT_EQ(res1, MakeUInt128(0x40000000U, 0U)); // imm8 = 0b00001111 __uint128_t res2 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #3.8750e+00")(); ASSERT_EQ(res2, MakeUInt128(0x40780000U, 0U)); // imm8 = 0b00110000 __uint128_t res3 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #1.60e+01")(); ASSERT_EQ(res3, MakeUInt128(0x41800000U, 0U)); // imm8 = 0b00111111 __uint128_t res4 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #3.10e+01")(); ASSERT_EQ(res4, MakeUInt128(0x41f80000U, 0U)); // imm8 = 0b01000000 __uint128_t res5 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #1.250e-01")(); ASSERT_EQ(res5, MakeUInt128(0x3e000000U, 0U)); // imm8 = 0b01001111 __uint128_t res6 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #2.4218750e-01")(); ASSERT_EQ(res6, MakeUInt128(0x3e780000U, 0U)); // imm8 = 0b01110000 __uint128_t res7 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #1.0e+00")(); ASSERT_EQ(res7, MakeUInt128(0x3f800000U, 0U)); // imm8 = 0b01111111 __uint128_t res8 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #1.93750e+00")(); ASSERT_EQ(res8, MakeUInt128(0x3ff80000U, 0U)); // imm8 = 0b10000000 __uint128_t res9 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-2.0e+00")(); ASSERT_EQ(res9, MakeUInt128(0xc0000000U, 0U)); // imm8 = 0b10001111 __uint128_t res10 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-3.8750e+00")(); ASSERT_EQ(res10, MakeUInt128(0xc0780000U, 0U)); // imm8 = 0b10110000 __uint128_t res11 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-1.60e+01")(); ASSERT_EQ(res11, MakeUInt128(0xc1800000U, 0U)); // imm8 = 0b10111111 __uint128_t res12 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-3.10e+01")(); ASSERT_EQ(res12, MakeUInt128(0xc1f80000U, 0U)); // imm8 = 0b11000000 __uint128_t res13 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-1.250e-01")(); ASSERT_EQ(res13, MakeUInt128(0xbe000000U, 0U)); // imm8 = 0b11001111 __uint128_t res14 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-2.4218750e-01")(); ASSERT_EQ(res14, MakeUInt128(0xbe780000U, 0U)); // imm8 = 0b11110000 __uint128_t res15 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-1.0e+00")(); ASSERT_EQ(res15, MakeUInt128(0xbf800000U, 0U)); // imm8 = 0b11111111 __uint128_t res16 = ASM_INSN_WRAP_FUNC_W_RES("fmov s0, #-1.93750e+00")(); ASSERT_EQ(res16, MakeUInt128(0xbff80000U, 0U)); } TEST(Arm64InsnTest, MoveImmToFp64) { // The tests below verify that fmov works with various immediates. // Specifically, the instruction has an 8-bit immediate field consisting of // the following four subfields: // // - sign (one bit) // - upper exponent (one bit) // - lower exponent (two bits) // - mantisa (four bits) // // For example, we decompose imm8 = 0b01001111 into: // // - sign = 0 (positive) // - upper exponent = 1 // - lower exponent = 00 // - mantisa = 1111 // // This immediate corresponds to 64-bit floating point value: // // 0 011111111 00 1111 000000000000000000000000000000000000000000000000 // | | | | | // | | | | +- 48 zeros // | | | +------ mantisa // | | +--------- lower exponent // | +------------------- upper exponent (custom extended to 9 bits) // +--------------------- sign // // Thus we have: // // 1.11110000... * 2^(1020-1023) = 0.2421875 // // where 1.11110000... is in binary. // // See VFPExpandImm in the ARM Architecture Manual for details. // // We enumerate all possible 8-bit immediate encodings of the form: // // {0,1}{0,1}{00,11}{0000,1111} // // to verify that the decoder correctly splits the immediate into the // subfields and reconstructs the intended floating-point value. // imm8 = 0b00000000 __uint128_t res1 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #2.0e+00")(); ASSERT_EQ(res1, MakeUInt128(0x4000000000000000ULL, 0U)); // imm8 = 0b00001111 __uint128_t res2 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #3.8750e+00")(); ASSERT_EQ(res2, MakeUInt128(0x400f000000000000ULL, 0U)); // imm8 = 0b00110000 __uint128_t res3 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #1.60e+01")(); ASSERT_EQ(res3, MakeUInt128(0x4030000000000000ULL, 0U)); // imm8 = 0b00111111 __uint128_t res4 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #3.10e+01")(); ASSERT_EQ(res4, MakeUInt128(0x403f000000000000ULL, 0U)); // imm8 = 0b01000000 __uint128_t res5 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #1.250e-01")(); ASSERT_EQ(res5, MakeUInt128(0x3fc0000000000000ULL, 0U)); // imm8 = 0b01001111 __uint128_t res6 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #2.4218750e-01")(); ASSERT_EQ(res6, MakeUInt128(0x3fcf000000000000ULL, 0U)); // imm8 = 0b01110000 __uint128_t res7 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #1.0e+00")(); ASSERT_EQ(res7, MakeUInt128(0x3ff0000000000000ULL, 0U)); // imm8 = 0b01111111 __uint128_t res8 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #1.93750e+00")(); ASSERT_EQ(res8, MakeUInt128(0x3fff000000000000ULL, 0U)); // imm8 = 0b10000000 __uint128_t res9 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-2.0e+00")(); ASSERT_EQ(res9, MakeUInt128(0xc000000000000000ULL, 0U)); // imm8 = 0b10001111 __uint128_t res10 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-3.8750e+00")(); ASSERT_EQ(res10, MakeUInt128(0xc00f000000000000ULL, 0U)); // imm8 = 0b10110000 __uint128_t res11 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-1.60e+01")(); ASSERT_EQ(res11, MakeUInt128(0xc030000000000000ULL, 0U)); // imm8 = 0b10111111 __uint128_t res12 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-3.10e+01")(); ASSERT_EQ(res12, MakeUInt128(0xc03f000000000000ULL, 0U)); // imm8 = 0b11000000 __uint128_t res13 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-1.250e-01")(); ASSERT_EQ(res13, MakeUInt128(0xbfc0000000000000ULL, 0U)); // imm8 = 0b11001111 __uint128_t res14 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-2.4218750e-01")(); ASSERT_EQ(res14, MakeUInt128(0xbfcf000000000000ULL, 0U)); // imm8 = 0b11110000 __uint128_t res15 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-1.0e+00")(); ASSERT_EQ(res15, MakeUInt128(0xbff0000000000000ULL, 0U)); // imm8 = 0b11111111 __uint128_t res16 = ASM_INSN_WRAP_FUNC_W_RES("fmov %d0, #-1.93750e+00")(); ASSERT_EQ(res16, MakeUInt128(0xbfff000000000000ULL, 0U)); } TEST(Arm64InsnTest, MoveImmToF32x4) { // The tests below verify that fmov works with various immediates. // Specifically, the instruction has an 8-bit immediate field consisting of // the following four subfields: // // - sign (one bit) // - upper exponent (one bit) // - lower exponent (two bits) // - mantisa (four bits) // // We enumerate all possible 8-bit immediate encodings of the form: // // {0,1}{0,1}{00,11}{0000,1111} // // to verify that the decoder correctly splits the immediate into the // subfields and reconstructs the intended floating-point value. // imm8 = 0b00000000 __uint128_t res1 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #2.0e+00")(); ASSERT_EQ(res1, MakeUInt128(0x4000000040000000ULL, 0x4000000040000000ULL)); // imm8 = 0b00001111 __uint128_t res2 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #3.8750e+00")(); ASSERT_EQ(res2, MakeUInt128(0x4078000040780000ULL, 0x4078000040780000ULL)); // imm8 = 0b00110000 __uint128_t res3 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #1.60e+01")(); ASSERT_EQ(res3, MakeUInt128(0x4180000041800000ULL, 0x4180000041800000ULL)); // imm8 = 0b00111111 __uint128_t res4 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #3.10e+01")(); ASSERT_EQ(res4, MakeUInt128(0x41f8000041f80000ULL, 0x41f8000041f80000ULL)); // imm8 = 0b01000000 __uint128_t res5 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #1.250e-01")(); ASSERT_EQ(res5, MakeUInt128(0x3e0000003e000000ULL, 0x3e0000003e000000ULL)); // imm8 = 0b01001111 __uint128_t res6 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #2.4218750e-01")(); ASSERT_EQ(res6, MakeUInt128(0x3e7800003e780000ULL, 0x3e7800003e780000ULL)); // imm8 = 0b01110000 __uint128_t res7 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #1.0e+00")(); ASSERT_EQ(res7, MakeUInt128(0x3f8000003f800000ULL, 0x3f8000003f800000ULL)); // imm8 = 0b01111111 __uint128_t res8 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #1.93750e+00")(); ASSERT_EQ(res8, MakeUInt128(0x3ff800003ff80000ULL, 0x3ff800003ff80000ULL)); // imm8 = 0b10000000 __uint128_t res9 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-2.0e+00")(); ASSERT_EQ(res9, MakeUInt128(0xc0000000c0000000ULL, 0xc0000000c0000000ULL)); // imm8 = 0b10001111 __uint128_t res10 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-3.8750e+00")(); ASSERT_EQ(res10, MakeUInt128(0xc0780000c0780000ULL, 0xc0780000c0780000ULL)); // imm8 = 0b10110000 __uint128_t res11 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-1.60e+01")(); ASSERT_EQ(res11, MakeUInt128(0xc1800000c1800000ULL, 0xc1800000c1800000ULL)); // imm8 = 0b10111111 __uint128_t res12 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-3.10e+01")(); ASSERT_EQ(res12, MakeUInt128(0xc1f80000c1f80000ULL, 0xc1f80000c1f80000ULL)); // imm8 = 0b11000000 __uint128_t res13 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-1.250e-01")(); ASSERT_EQ(res13, MakeUInt128(0xbe000000be000000ULL, 0xbe000000be000000ULL)); // imm8 = 0b11001111 __uint128_t res14 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-2.4218750e-01")(); ASSERT_EQ(res14, MakeUInt128(0xbe780000be780000ULL, 0xbe780000be780000ULL)); // imm8 = 0b11110000 __uint128_t res15 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-1.0e+00")(); ASSERT_EQ(res15, MakeUInt128(0xbf800000bf800000ULL, 0xbf800000bf800000ULL)); // imm8 = 0b11111111 __uint128_t res16 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.4s, #-1.93750e+00")(); ASSERT_EQ(res16, MakeUInt128(0xbff80000bff80000ULL, 0xbff80000bff80000ULL)); } TEST(Arm64InsnTest, MoveImmToF64x2) { // The tests below verify that fmov works with various immediates. // Specifically, the instruction has an 8-bit immediate field consisting of // the following four subfields: // // - sign (one bit) // - upper exponent (one bit) // - lower exponent (two bits) // - mantisa (four bits) // // We enumerate all possible 8-bit immediate encodings of the form: // // {0,1}{0,1}{00,11}{0000,1111} // // to verify that the decoder correctly splits the immediate into the // subfields and reconstructs the intended floating-point value. // imm8 = 0b00000000 __uint128_t res1 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #2.0e+00")(); ASSERT_EQ(res1, MakeUInt128(0x4000000000000000ULL, 0x4000000000000000ULL)); // imm8 = 0b00001111 __uint128_t res2 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #3.8750e+00")(); ASSERT_EQ(res2, MakeUInt128(0x400f000000000000ULL, 0x400f000000000000ULL)); // imm8 = 0b00110000 __uint128_t res3 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #1.60e+01")(); ASSERT_EQ(res3, MakeUInt128(0x4030000000000000ULL, 0x4030000000000000ULL)); // imm8 = 0b00111111 __uint128_t res4 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #3.10e+01")(); ASSERT_EQ(res4, MakeUInt128(0x403f000000000000ULL, 0x403f000000000000ULL)); // imm8 = 0b01000000 __uint128_t res5 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #1.250e-01")(); ASSERT_EQ(res5, MakeUInt128(0x3fc0000000000000ULL, 0x3fc0000000000000ULL)); // imm8 = 0b01001111 __uint128_t res6 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #2.4218750e-01")(); ASSERT_EQ(res6, MakeUInt128(0x3fcf000000000000ULL, 0x3fcf000000000000ULL)); // imm8 = 0b01110000 __uint128_t res7 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #1.0e+00")(); ASSERT_EQ(res7, MakeUInt128(0x3ff0000000000000ULL, 0x3ff0000000000000ULL)); // imm8 = 0b01111111 __uint128_t res8 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #1.93750e+00")(); ASSERT_EQ(res8, MakeUInt128(0x3fff000000000000ULL, 0x3fff000000000000ULL)); // imm8 = 0b10000000 __uint128_t res9 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-2.0e+00")(); ASSERT_EQ(res9, MakeUInt128(0xc000000000000000ULL, 0xc000000000000000ULL)); // imm8 = 0b10001111 __uint128_t res10 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-3.8750e+00")(); ASSERT_EQ(res10, MakeUInt128(0xc00f000000000000ULL, 0xc00f000000000000ULL)); // imm8 = 0b10110000 __uint128_t res11 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-1.60e+01")(); ASSERT_EQ(res11, MakeUInt128(0xc030000000000000ULL, 0xc030000000000000ULL)); // imm8 = 0b10111111 __uint128_t res12 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-3.10e+01")(); ASSERT_EQ(res12, MakeUInt128(0xc03f000000000000ULL, 0xc03f000000000000ULL)); // imm8 = 0b11000000 __uint128_t res13 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-1.250e-01")(); ASSERT_EQ(res13, MakeUInt128(0xbfc0000000000000ULL, 0xbfc0000000000000ULL)); // imm8 = 0b11001111 __uint128_t res14 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-2.4218750e-01")(); ASSERT_EQ(res14, MakeUInt128(0xbfcf000000000000ULL, 0xbfcf000000000000ULL)); // imm8 = 0b11110000 __uint128_t res15 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-1.0e+00")(); ASSERT_EQ(res15, MakeUInt128(0xbff0000000000000ULL, 0xbff0000000000000ULL)); // imm8 = 0b11111111 __uint128_t res16 = ASM_INSN_WRAP_FUNC_W_RES("fmov %0.2d, #-1.93750e+00")(); ASSERT_EQ(res16, MakeUInt128(0xbfff000000000000ULL, 0xbfff000000000000ULL)); } TEST(Arm64InsnTest, MoveFpRegToReg) { __uint128_t arg = MakeUInt128(0x1111aaaa2222bbbbULL, 0x3333cccc4444ddddULL); uint64_t res = 0xffffeeeeddddccccULL; // Move from high double. asm("fmov %0, %1.d[1]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x3333cccc4444ddddULL); // Move from low double. asm("fmov %0, %d1" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x1111aaaa2222bbbbULL); // Move from single. asm("fmov %w0, %s1" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x2222bbbbULL); } TEST(Arm64InsnTest, MoveRegToFpReg) { uint64_t arg = 0xffffeeeeddddccccULL; __uint128_t res = MakeUInt128(0x1111aaaa2222bbbbULL, 0x3333cccc4444ddddULL); // Move to high double. asm("fmov %0.d[1], %1" : "=w"(res) : "r"(arg), "0"(res)); ASSERT_EQ(res, MakeUInt128(0x1111aaaa2222bbbbULL, 0xffffeeeeddddccccULL)); // Move to low double. asm("fmov %d0, %1" : "=w"(res) : "r"(arg)); ASSERT_EQ(res, MakeUInt128(0xffffeeeeddddccccULL, 0x0)); // Move to single. asm("fmov %s0, %w1" : "=w"(res) : "r"(arg)); ASSERT_EQ(res, MakeUInt128(0xddddccccULL, 0x0)); } TEST(Arm64InsnTest, MoveFpRegToFpReg) { __uint128_t res; __uint128_t fp64_arg = MakeUInt128(0x402e9eb851eb851fULL, 0xdeadbeefaabbccddULL); // 15.31 in double asm("fmov %d0, %d1" : "=w"(res) : "w"(fp64_arg)); ASSERT_EQ(res, MakeUInt128(0x402e9eb851eb851fULL, 0ULL)); __uint128_t fp32_arg = MakeUInt128(0xaabbccdd40e51eb8ULL, 0x0011223344556677ULL); // 7.16 in float asm("fmov %s0, %s1" : "=w"(res) : "w"(fp32_arg)); ASSERT_EQ(res, MakeUInt128(0x40e51eb8ULL, 0ULL)); } TEST(Arm64InsnTest, InsertRegPartIntoSimd128) { uint64_t arg = 0xffffeeeeddddccccULL; __uint128_t res = MakeUInt128(0x1111aaaa2222bbbbULL, 0x3333cccc4444ddddULL); // Byte. asm("mov %0.b[3], %w1" : "=w"(res) : "r"(arg), "0"(res)); ASSERT_EQ(res, MakeUInt128(0x1111aaaacc22bbbbULL, 0x3333cccc4444ddddULL)); // Double word. asm("mov %0.d[1], %1" : "=w"(res) : "r"(arg), "0"(res)); ASSERT_EQ(res, MakeUInt128(0x1111aaaacc22bbbbULL, 0xffffeeeeddddccccULL)); } TEST(Arm64InsnTest, DuplicateRegIntoSimd128) { __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("dup %0.16b, %w1")(0xabU); ASSERT_EQ(res, MakeUInt128(0xababababababababULL, 0xababababababababULL)); } TEST(Arm64InsnTest, MoveSimd128ElemToRegSigned) { uint64_t res = 0; __uint128_t arg = MakeUInt128(0x9796959493929190ULL, 0x9f9e9d9c9b9a99ULL); // Single word. asm("smov %0, %1.s[0]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xffffffff93929190ULL); asm("smov %0, %1.s[2]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xffffffff9c9b9a99ULL); // Half word. asm("smov %w0, %1.h[0]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x00000000ffff9190ULL); asm("smov %w0, %1.h[2]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x00000000ffff9594ULL); // Byte. asm("smov %w0, %1.b[0]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x00000000ffffff90ULL); asm("smov %w0, %1.b[2]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x00000000ffffff92ULL); } TEST(Arm64InsnTest, MoveSimd128ElemToRegUnsigned) { uint64_t res = 0; __uint128_t arg = MakeUInt128(0xaaaabbbbcccceeeeULL, 0xffff000011112222ULL); // Double word. asm("umov %0, %1.d[0]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xaaaabbbbcccceeeeULL); asm("umov %0, %1.d[1]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xffff000011112222ULL); // Single word. asm("umov %w0, %1.s[0]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xcccceeeeULL); asm("umov %w0, %1.s[2]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0x11112222ULL); // Half word. asm("umov %w0, %1.h[0]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xeeeeULL); asm("umov %w0, %1.h[2]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xbbbbULL); // Byte. asm("umov %w0, %1.b[0]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xeeULL); asm("umov %w0, %1.b[2]" : "=r"(res) : "w"(arg)); ASSERT_EQ(res, 0xccULL); } TEST(Arm64InsnTest, SignedMultiplyAddLongElemI16x4) { __uint128_t arg1 = MakeUInt128(0x9463229563989898ULL, 0x9358211674562701ULL); __uint128_t arg2 = MakeUInt128(0x0218356462201349ULL, 0x6715188190973038ULL); __uint128_t arg3 = MakeUInt128(0x1198004973407239ULL, 0x6103685406643193ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("smlal %0.4s, %1.4h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x37c4a3494b9db539ULL, 0x37c3dab413a58e33ULL)); } TEST(Arm64InsnTest, SignedMultiplyAddLongElemI16x4Upper) { __uint128_t arg1 = MakeUInt128(0x9478221818528624ULL, 0x0851400666044332ULL); __uint128_t arg2 = MakeUInt128(0x5888569867054315ULL, 0x4706965747458550ULL); __uint128_t arg3 = MakeUInt128(0x3323233421073015ULL, 0x4594051655379068ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("smlal2 %0.4s, %1.8h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x5c30bd483c119e0fULL, 0x48ecc5ab6efb3a86ULL)); } TEST(Arm64InsnTest, SignedMultiplyAddLongElemI16x4Upper2) { __uint128_t arg1 = MakeUInt128(0x9968262824727064ULL, 0x1336222178923903ULL); __uint128_t arg2 = MakeUInt128(0x1760854289437339ULL, 0x3561889165125042ULL); __uint128_t arg3 = MakeUInt128(0x4404008952719837ULL, 0x8738648058472689ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("smlal2 %0.4s, %1.8h, %2.h[7]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x5d27e9db5e54d15aULL, 0x8b39d9f65f64ea0aULL)); } TEST(Arm64InsnTest, SignedMultiplySubtractLongElemI16x4) { __uint128_t arg1 = MakeUInt128(0x9143447886360410ULL, 0x3182350736502778ULL); __uint128_t arg2 = MakeUInt128(0x5908975782727313ULL, 0x0504889398900992ULL); __uint128_t arg3 = MakeUInt128(0x3913503373250855ULL, 0x9826558670892426ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("smlsl %0.4s, %1.4h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0xfd58202775231935ULL, 0x61d69fb0921db6b6ULL)); } TEST(Arm64InsnTest, SignedMultiplySubtractLongElemI16x4Upper) { __uint128_t arg1 = MakeUInt128(0x9320199199688285ULL, 0x1718395366913452ULL); __uint128_t arg2 = MakeUInt128(0x2244470804592396ULL, 0x6028171565515656ULL); __uint128_t arg3 = MakeUInt128(0x6611135982311225ULL, 0x0628905854914509ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("smlsl2 %0.4s, %1.8h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x645326f0814d99a3ULL, 0x05c4290053980b2eULL)); } TEST(Arm64InsnTest, UnsignedMultiplyAddLongElemI16x4) { __uint128_t arg1 = MakeUInt128(0x9027601834840306ULL, 0x8113818551059797ULL); __uint128_t arg2 = MakeUInt128(0x0566400750942608ULL, 0x7885735796037324ULL); __uint128_t arg3 = MakeUInt128(0x5141467867036880ULL, 0x9880609716425849ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("umlal %0.4s, %1.4h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x61c8e2c867f707f8ULL, 0xc5dfe72334816629ULL)); } TEST(Arm64InsnTest, UnsignedMultiplyAddLongElemI16x4Upper) { __uint128_t arg1 = MakeUInt128(0x9454236828860613ULL, 0x4084148637767009ULL); __uint128_t arg2 = MakeUInt128(0x6120715124914043ULL, 0x0272538607648236ULL); __uint128_t arg3 = MakeUInt128(0x3414334623518975ULL, 0x7664521641376796ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("umlal2 %0.4s, %1.8h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x3c00351c3352428eULL, 0x7f9b6cda4425df7cULL)); } TEST(Arm64InsnTest, UnsignedMultiplySubtractLongElemI16x4) { __uint128_t arg1 = MakeUInt128(0x9128009282525619ULL, 0x0205263016391147ULL); __uint128_t arg2 = MakeUInt128(0x7247331485739107ULL, 0x7758744253876117ULL); __uint128_t arg3 = MakeUInt128(0x4657867116941477ULL, 0x6421441111263583ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("umlsl %0.4s, %1.4h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x0268619be9b26a3cULL, 0x1876471910da19edULL)); } TEST(Arm64InsnTest, UnsignedMultiplySubtractLongElemI16x4Upper) { __uint128_t arg1 = MakeUInt128(0x9420757136275167ULL, 0x4573189189456283ULL); __uint128_t arg2 = MakeUInt128(0x5257044133543758ULL, 0x5753426986994725ULL); __uint128_t arg3 = MakeUInt128(0x4703165661399199ULL, 0x9682628247270641ULL); __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_WW0_ARG("umlsl2 %0.4s, %1.8h, %2.h[1]")(arg1, arg2, arg3); ASSERT_EQ(res, MakeUInt128(0x2b7d4cb24d79259dULL, 0x8895afc6423a13adULL)); } TEST(Arm64InsnTest, AsmConvertI32F32) { constexpr auto AsmConvertI32F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %s0, %w1"); ASSERT_EQ(AsmConvertI32F32(21), MakeUInt128(0x41a80000U, 0U)); } TEST(Arm64InsnTest, AsmConvertU32F32) { constexpr auto AsmConvertU32F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %s0, %w1"); ASSERT_EQ(AsmConvertU32F32(29), MakeUInt128(0x41e80000U, 0U)); // Test that the topmost bit isn't treated as the sign. ASSERT_EQ(AsmConvertU32F32(1U << 31), MakeUInt128(0x4f000000U, 0U)); } TEST(Arm64InsnTest, AsmConvertU32F32FromSimdReg) { constexpr auto AsmUcvtf = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %s0, %s1"); ASSERT_EQ(AsmUcvtf(28), MakeUInt128(0x41e00000U, 0U)); // Test that the topmost bit isn't treated as the sign. ASSERT_EQ(AsmUcvtf(1U << 31), MakeUInt128(0x4f000000U, 0U)); } TEST(Arm64InsnTest, AsmConvertI32F64) { constexpr auto AsmConvertI32F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %d0, %w1"); ASSERT_EQ(AsmConvertI32F64(21), MakeUInt128(0x4035000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertU32F64) { constexpr auto AsmConvertU32F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %d0, %w1"); ASSERT_EQ(AsmConvertU32F64(18), MakeUInt128(0x4032000000000000ULL, 0U)); // Test that the topmost bit isn't treated as the sign. ASSERT_EQ(AsmConvertU32F64(1U << 31), MakeUInt128(0x41e0000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertI64F32) { constexpr auto AsmConvertI64F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %s0, %x1"); ASSERT_EQ(AsmConvertI64F32(11), MakeUInt128(0x41300000U, 0U)); } TEST(Arm64InsnTest, AsmConvertU64F32) { constexpr auto AsmConvertU64F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %s0, %x1"); ASSERT_EQ(AsmConvertU64F32(3), MakeUInt128(0x40400000U, 0U)); // Test that the topmost bit isn't treated as the sign. ASSERT_EQ(AsmConvertU64F32(1ULL << 63), MakeUInt128(0x5f000000U, 0U)); } TEST(Arm64InsnTest, AsmConvertI64F64) { constexpr auto AsmConvertI64F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %d0, %x1"); ASSERT_EQ(AsmConvertI64F64(137), MakeUInt128(0x4061200000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertI32F32FromSimdReg) { constexpr auto AsmConvertI32F32 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %s0, %s1"); ASSERT_EQ(AsmConvertI32F32(1109), MakeUInt128(0x448aa000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertI64F64FromSimdReg) { constexpr auto AsmConvertI64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %d0, %d1"); ASSERT_EQ(AsmConvertI64F64(123), MakeUInt128(0x405ec00000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertI32x4F32x4) { constexpr auto AsmConvertI32F32 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %0.4s, %1.4s"); __uint128_t arg = MakeUInt128(0x0000003500000014ULL, 0x0000005400000009ULL); ASSERT_EQ(AsmConvertI32F32(arg), MakeUInt128(0x4254000041a00000ULL, 0x42a8000041100000ULL)); } TEST(Arm64InsnTest, AsmConvertI64x2F64x2) { constexpr auto AsmConvertI64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %0.2d, %1.2d"); __uint128_t arg = MakeUInt128(static_cast(-9), 17U); ASSERT_EQ(AsmConvertI64F64(arg), MakeUInt128(0xc022000000000000ULL, 0x4031000000000000ULL)); } TEST(Arm64InsnTest, AsmConvertU32x4F32x4) { constexpr auto AsmConvertU32F32 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %0.4s, %1.4s"); __uint128_t arg = MakeUInt128(0x8000000000000019ULL, 0x0000005800000010ULL); ASSERT_EQ(AsmConvertU32F32(arg), MakeUInt128(0x4f00000041c80000ULL, 0x42b0000041800000ULL)); } TEST(Arm64InsnTest, AsmConvertU64x2F64x2) { constexpr auto AsmConvertU64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %0.2d, %1.2d"); __uint128_t arg = MakeUInt128(1ULL << 63, 29U); ASSERT_EQ(AsmConvertU64F64(arg), MakeUInt128(0x43e0000000000000ULL, 0x403d000000000000ULL)); } TEST(Arm64InsnTest, AsmConvertU64F64) { constexpr auto AsmConvertU64F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %d0, %x1"); ASSERT_EQ(AsmConvertU64F64(49), MakeUInt128(0x4048800000000000ULL, 0U)); // Test that the topmost bit isn't treated as the sign. ASSERT_EQ(AsmConvertU64F64(1ULL << 63), MakeUInt128(0x43e0000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertU64F64FromSimdReg) { constexpr auto AsmUcvtf = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %d0, %d1"); ASSERT_EQ(AsmUcvtf(47), MakeUInt128(0x4047800000000000ULL, 0U)); // Test that the topmost bit isn't treated as the sign. ASSERT_EQ(AsmUcvtf(1ULL << 63), MakeUInt128(0x43e0000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertLiterals) { // Verify that the compiler encodes the floating-point literals used in the // conversion tests below exactly as expected. ASSERT_EQ(bit_cast(-7.50f), 0xc0f00000U); ASSERT_EQ(bit_cast(-6.75f), 0xc0d80000U); ASSERT_EQ(bit_cast(-6.50f), 0xc0d00000U); ASSERT_EQ(bit_cast(-6.25f), 0xc0c80000U); ASSERT_EQ(bit_cast(6.25f), 0x40c80000U); ASSERT_EQ(bit_cast(6.50f), 0x40d00000U); ASSERT_EQ(bit_cast(6.75f), 0x40d80000U); ASSERT_EQ(bit_cast(7.50f), 0x40f00000U); ASSERT_EQ(bit_cast(-7.50), 0xc01e000000000000ULL); ASSERT_EQ(bit_cast(-6.75), 0xc01b000000000000ULL); ASSERT_EQ(bit_cast(-6.50), 0xc01a000000000000ULL); ASSERT_EQ(bit_cast(-6.25), 0xc019000000000000ULL); ASSERT_EQ(bit_cast(6.25), 0x4019000000000000ULL); ASSERT_EQ(bit_cast(6.50), 0x401a000000000000ULL); ASSERT_EQ(bit_cast(6.75), 0x401b000000000000ULL); ASSERT_EQ(bit_cast(7.50), 0x401e000000000000ULL); } template void TestConvertF32ToInt(FuncType AsmFunc, std::initializer_list expected) { // Note that bit_cast isn't a constexpr. static const uint32_t kConvertF32ToIntInputs[] = { bit_cast(-7.50f), bit_cast(-6.75f), bit_cast(-6.50f), bit_cast(-6.25f), bit_cast(6.25f), bit_cast(6.50f), bit_cast(6.75f), bit_cast(7.50f), }; const size_t kConvertF32ToIntInputsSize = sizeof(kConvertF32ToIntInputs) / sizeof(uint32_t); ASSERT_EQ(kConvertF32ToIntInputsSize, expected.size()); auto expected_it = expected.begin(); for (size_t input_it = 0; input_it < kConvertF32ToIntInputsSize; input_it++) { ASSERT_EQ(AsmFunc(kConvertF32ToIntInputs[input_it]), static_cast(*expected_it++)); } } TEST(Arm64InsnTest, AsmConvertF32I32TieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtas %w0, %s1"); TestConvertF32ToInt(AsmFcvtas, {-8, -7, -7, -6, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U32TieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtau %w0, %s1"); TestConvertF32ToInt(AsmFcvtau, {0U, 0U, 0U, 0U, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I32NegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtms %w0, %s1"); TestConvertF32ToInt(AsmFcvtms, {-8, -7, -7, -7, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32U32NegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtmu %w0, %s1"); TestConvertF32ToInt(AsmFcvtmu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32I32TieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtns %w0, %s1"); TestConvertF32ToInt(AsmFcvtns, {-8, -7, -6, -6, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U32TieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtnu %w0, %s1"); TestConvertF32ToInt(AsmFcvtnu, {0U, 0U, 0U, 0U, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I32PosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtps %w0, %s1"); TestConvertF32ToInt(AsmFcvtps, {-7, -6, -6, -6, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U32PosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtpu %w0, %s1"); TestConvertF32ToInt(AsmFcvtpu, {0U, 0U, 0U, 0U, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I32Truncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %w0, %s1"); TestConvertF32ToInt(AsmFcvtzs, {-7, -6, -6, -6, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32U32Truncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %w0, %s1"); TestConvertF32ToInt(AsmFcvtzu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32I64TieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtas %x0, %s1"); TestConvertF32ToInt(AsmFcvtas, {-8, -7, -7, -6, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U64TieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtau %x0, %s1"); TestConvertF32ToInt(AsmFcvtau, {0U, 0U, 0U, 0U, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I64NegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtms %x0, %s1"); TestConvertF32ToInt(AsmFcvtms, {-8, -7, -7, -7, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32U64NegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtmu %x0, %s1"); TestConvertF32ToInt(AsmFcvtmu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32I64TieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtns %x0, %s1"); TestConvertF32ToInt(AsmFcvtns, {-8, -7, -6, -6, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U64TieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtnu %x0, %s1"); TestConvertF32ToInt(AsmFcvtnu, {0U, 0U, 0U, 0U, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I64PosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtps %x0, %s1"); TestConvertF32ToInt(AsmFcvtps, {-7, -6, -6, -6, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U64PosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtpu %x0, %s1"); TestConvertF32ToInt(AsmFcvtpu, {0U, 0U, 0U, 0U, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I64Truncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %x0, %s1"); TestConvertF32ToInt(AsmFcvtzs, {-7, -6, -6, -6, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32U64Truncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %x0, %s1"); TestConvertF32ToInt(AsmFcvtzu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } template void TestConvertF64ToInt(FuncType AsmFunc, std::initializer_list expected) { // Note that bit_cast isn't a constexpr. static const uint64_t kConvertF64ToIntInputs[] = { bit_cast(-7.50), bit_cast(-6.75), bit_cast(-6.50), bit_cast(-6.25), bit_cast(6.25), bit_cast(6.50), bit_cast(6.75), bit_cast(7.50), }; const size_t kConvertF64ToIntInputsSize = sizeof(kConvertF64ToIntInputs) / sizeof(uint64_t); ASSERT_EQ(kConvertF64ToIntInputsSize, expected.size()); auto expected_it = expected.begin(); for (size_t input_it = 0; input_it < kConvertF64ToIntInputsSize; input_it++) { ASSERT_EQ(AsmFunc(kConvertF64ToIntInputs[input_it]), static_cast(*expected_it++)); } } TEST(Arm64InsnTest, AsmConvertF64I32TieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtas %w0, %d1"); TestConvertF64ToInt(AsmFcvtas, {-8, -7, -7, -6, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U32TieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtau %w0, %d1"); TestConvertF64ToInt(AsmFcvtau, {0U, 0U, 0U, 0U, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I32NegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtms %w0, %d1"); TestConvertF64ToInt(AsmFcvtms, {-8, -7, -7, -7, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64U32NegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtmu %w0, %d1"); TestConvertF64ToInt(AsmFcvtmu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64I32TieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtns %w0, %d1"); TestConvertF64ToInt(AsmFcvtns, {-8, -7, -6, -6, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U32TieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtnu %w0, %d1"); TestConvertF64ToInt(AsmFcvtnu, {0U, 0U, 0U, 0U, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I32PosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtps %w0, %d1"); TestConvertF64ToInt(AsmFcvtps, {-7, -6, -6, -6, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U32PosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtpu %w0, %d1"); TestConvertF64ToInt(AsmFcvtpu, {0U, 0U, 0U, 0U, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I32Truncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %w0, %d1"); TestConvertF64ToInt(AsmFcvtzs, {-7, -6, -6, -6, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64U32Truncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %w0, %d1"); TestConvertF64ToInt(AsmFcvtzu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64I64TieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtas %x0, %d1"); TestConvertF64ToInt(AsmFcvtas, {-8, -7, -7, -6, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U64TieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtau %x0, %d1"); TestConvertF64ToInt(AsmFcvtau, {0U, 0U, 0U, 0U, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I64NegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtms %x0, %d1"); TestConvertF64ToInt(AsmFcvtms, {-8, -7, -7, -7, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64U64NegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtmu %x0, %d1"); TestConvertF64ToInt(AsmFcvtmu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64I64TieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtns %x0, %d1"); TestConvertF64ToInt(AsmFcvtns, {-8, -7, -6, -6, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U64TieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtnu %x0, %d1"); TestConvertF64ToInt(AsmFcvtnu, {0U, 0U, 0U, 0U, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I64PosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtps %x0, %d1"); TestConvertF64ToInt(AsmFcvtps, {-7, -6, -6, -6, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U64PosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtpu %x0, %d1"); TestConvertF64ToInt(AsmFcvtpu, {0U, 0U, 0U, 0U, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I64Truncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %x0, %d1"); TestConvertF64ToInt(AsmFcvtzs, {-7, -6, -6, -6, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64U64Truncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %x0, %d1"); TestConvertF64ToInt(AsmFcvtzu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32I32ScalarTieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtas %s0, %s1"); TestConvertF32ToInt(AsmFcvtas, {-8, -7, -7, -6, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U32ScalarTieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtau %s0, %s1"); TestConvertF32ToInt(AsmFcvtau, {0U, 0U, 0U, 0U, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I32ScalarNegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtms %s0, %s1"); TestConvertF32ToInt(AsmFcvtms, {-8, -7, -7, -7, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32U32ScalarNegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtmu %s0, %s1"); TestConvertF32ToInt(AsmFcvtmu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32I32ScalarTieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtns %s0, %s1"); TestConvertF32ToInt(AsmFcvtns, {-8, -7, -6, -6, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U32ScalarTieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtnu %s0, %s1"); TestConvertF32ToInt(AsmFcvtnu, {0U, 0U, 0U, 0U, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I32ScalarPosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtps %s0, %s1"); TestConvertF32ToInt(AsmFcvtps, {-7, -6, -6, -6, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32U32ScalarPosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtpu %s0, %s1"); TestConvertF32ToInt(AsmFcvtpu, {0U, 0U, 0U, 0U, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF32I32ScalarTruncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzs %s0, %s1"); TestConvertF32ToInt(AsmFcvtzs, {-7, -6, -6, -6, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32U32ScalarTruncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzu %s0, %s1"); TestConvertF32ToInt(AsmFcvtzu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64I64ScalarTieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtas %d0, %d1"); TestConvertF64ToInt(AsmFcvtas, {-8, -7, -7, -6, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U64ScalarTieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtau %d0, %d1"); TestConvertF64ToInt(AsmFcvtau, {0U, 0U, 0U, 0U, 6U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I64ScalarNegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtms %d0, %d1"); TestConvertF64ToInt(AsmFcvtms, {-8, -7, -7, -7, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64U64ScalarNegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtmu %d0, %d1"); TestConvertF64ToInt(AsmFcvtmu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64I64ScalarTieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtns %d0, %d1"); TestConvertF64ToInt(AsmFcvtns, {-8, -7, -6, -6, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U64ScalarTieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtnu %d0, %d1"); TestConvertF64ToInt(AsmFcvtnu, {0U, 0U, 0U, 0U, 6U, 6U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I64ScalarPosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtps %d0, %d1"); TestConvertF64ToInt(AsmFcvtps, {-7, -6, -6, -6, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64U64ScalarPosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtpu %d0, %d1"); TestConvertF64ToInt(AsmFcvtpu, {0U, 0U, 0U, 0U, 7U, 7U, 7U, 8U}); } TEST(Arm64InsnTest, AsmConvertF64I64ScalarTruncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzs %d0, %d1"); TestConvertF64ToInt(AsmFcvtzs, {-7, -6, -6, -6, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF64U64ScalarTruncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzu %d0, %d1"); TestConvertF64ToInt(AsmFcvtzu, {0U, 0U, 0U, 0U, 6U, 6U, 6U, 7U}); } TEST(Arm64InsnTest, AsmConvertF32I32x4TieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtas %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtas(arg1), MakeUInt128(0xfffffff9fffffff8ULL, 0xfffffffafffffff9ULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtas(arg2), MakeUInt128(0x0000000700000006ULL, 0x0000000800000007ULL)); } TEST(Arm64InsnTest, AsmConvertF32U32x4TieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtau %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtau(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtau(arg2), MakeUInt128(0x0000000700000006ULL, 0x0000000800000007ULL)); } TEST(Arm64InsnTest, AsmConvertF32I32x4NegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtms %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtms(arg1), MakeUInt128(0xfffffff9fffffff8ULL, 0xfffffff9fffffff9ULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtms(arg2), MakeUInt128(0x0000000600000006ULL, 0x0000000700000006ULL)); } TEST(Arm64InsnTest, AsmConvertF32U32x4NegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtmu %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtmu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtmu(arg2), MakeUInt128(0x0000000600000006ULL, 0x0000000700000006ULL)); } TEST(Arm64InsnTest, AsmConvertF32I32x4TieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtns %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtns(arg1), MakeUInt128(0xfffffff9fffffff8ULL, 0xfffffffafffffffaULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtns(arg2), MakeUInt128(0x0000000600000006ULL, 0x0000000800000007ULL)); } TEST(Arm64InsnTest, AsmConvertF32U32x4TieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtnu %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtnu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtnu(arg2), MakeUInt128(0x0000000600000006ULL, 0x0000000800000007ULL)); } TEST(Arm64InsnTest, AsmConvertF32I32x4PosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtps %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtps(arg1), MakeUInt128(0xfffffffafffffff9ULL, 0xfffffffafffffffaULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtps(arg2), MakeUInt128(0x0000000700000007ULL, 0x0000000800000007ULL)); } TEST(Arm64InsnTest, AsmConvertF32U32x4PosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtpu %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtpu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtpu(arg2), MakeUInt128(0x0000000700000007ULL, 0x0000000800000007ULL)); } TEST(Arm64InsnTest, AsmConvertF32I32x4Truncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzs %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtzs(arg1), MakeUInt128(0xfffffffafffffff9ULL, 0xfffffffafffffffaULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtzs(arg2), MakeUInt128(0x0000000600000006ULL, 0x0000000700000006ULL)); } TEST(Arm64InsnTest, AsmConvertF32U32x4Truncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzu %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtzu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtzu(arg2), MakeUInt128(0x0000000600000006ULL, 0x0000000700000006ULL)); } TEST(Arm64InsnTest, AsmConvertF64I64x4TieAway) { constexpr auto AsmFcvtas = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtas %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtas(arg1), MakeUInt128(0xfffffffffffffff8ULL, 0xfffffffffffffff9ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtas(arg2), MakeUInt128(0xfffffffffffffff9ULL, 0xfffffffffffffffaULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtas(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000007ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtas(arg4), MakeUInt128(0x0000000000000007ULL, 0x0000000000000008ULL)); } TEST(Arm64InsnTest, AsmConvertF64U64x4TieAway) { constexpr auto AsmFcvtau = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtau %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtau(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtau(arg2), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtau(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000007ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtau(arg4), MakeUInt128(0x0000000000000007ULL, 0x0000000000000008ULL)); } TEST(Arm64InsnTest, AsmConvertF64I64x4NegInf) { constexpr auto AsmFcvtms = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtms %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtms(arg1), MakeUInt128(0xfffffffffffffff8ULL, 0xfffffffffffffff9ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtms(arg2), MakeUInt128(0xfffffffffffffff9ULL, 0xfffffffffffffff9ULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtms(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000006ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtms(arg4), MakeUInt128(0x0000000000000006ULL, 0x0000000000000007ULL)); } TEST(Arm64InsnTest, AsmConvertF64U64x4NegInf) { constexpr auto AsmFcvtmu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtmu %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtmu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtmu(arg2), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtmu(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000006ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtmu(arg4), MakeUInt128(0x0000000000000006ULL, 0x0000000000000007ULL)); } TEST(Arm64InsnTest, AsmConvertF64I64x4TieEven) { constexpr auto AsmFcvtns = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtns %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtns(arg1), MakeUInt128(0xfffffffffffffff8ULL, 0xfffffffffffffff9ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtns(arg2), MakeUInt128(0xfffffffffffffffaULL, 0xfffffffffffffffaULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtns(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000006ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtns(arg4), MakeUInt128(0x0000000000000007ULL, 0x0000000000000008ULL)); } TEST(Arm64InsnTest, AsmConvertF64U64x4TieEven) { constexpr auto AsmFcvtnu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtnu %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtnu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtnu(arg2), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtnu(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000006ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtnu(arg4), MakeUInt128(0x0000000000000007ULL, 0x0000000000000008ULL)); } TEST(Arm64InsnTest, AsmConvertF64I64x4PosInf) { constexpr auto AsmFcvtps = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtps %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtps(arg1), MakeUInt128(0xfffffffffffffff9ULL, 0xfffffffffffffffaULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtps(arg2), MakeUInt128(0xfffffffffffffffaULL, 0xfffffffffffffffaULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtps(arg3), MakeUInt128(0x0000000000000007ULL, 0x0000000000000007ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtps(arg4), MakeUInt128(0x0000000000000007ULL, 0x0000000000000008ULL)); } TEST(Arm64InsnTest, AsmConvertF64U64x4PosInf) { constexpr auto AsmFcvtpu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtpu %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtpu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtpu(arg2), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtpu(arg3), MakeUInt128(0x0000000000000007ULL, 0x0000000000000007ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtpu(arg4), MakeUInt128(0x0000000000000007ULL, 0x0000000000000008ULL)); } TEST(Arm64InsnTest, AsmConvertF64I64x4Truncate) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzs %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtzs(arg1), MakeUInt128(0xfffffffffffffff9ULL, 0xfffffffffffffffaULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtzs(arg2), MakeUInt128(0xfffffffffffffffaULL, 0xfffffffffffffffaULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtzs(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000006ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtzs(arg4), MakeUInt128(0x0000000000000006ULL, 0x0000000000000007ULL)); } TEST(Arm64InsnTest, AsmConvertF64U64x4Truncate) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzu %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtzu(arg1), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtzu(arg2), MakeUInt128(0x0000000000000000ULL, 0x0000000000000000ULL)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtzu(arg3), MakeUInt128(0x0000000000000006ULL, 0x0000000000000006ULL)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtzu(arg4), MakeUInt128(0x0000000000000006ULL, 0x0000000000000007ULL)); } TEST(Arm64InsnTest, AsmConvertX32F32Scalar) { constexpr auto AsmConvertX32F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %s0, %w1, #7"); ASSERT_EQ(AsmConvertX32F32(0x610), MakeUInt128(0x41420000ULL, 0U)); ASSERT_EQ(AsmConvertX32F32(1U << 31), MakeUInt128(0xcb800000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertX32F64Scalar) { constexpr auto AsmConvertX32F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %d0, %w1, #8"); ASSERT_EQ(AsmConvertX32F64(0x487), MakeUInt128(0x40121c0000000000ULL, 0U)); ASSERT_EQ(AsmConvertX32F64(1 << 31), MakeUInt128(0xc160000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertX32F32) { constexpr auto AsmConvertX32F32 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %s0, %s1, #7"); ASSERT_EQ(AsmConvertX32F32(0x123), MakeUInt128(0x40118000ULL, 0U)); ASSERT_EQ(AsmConvertX32F32(1U << 31), MakeUInt128(0xcb800000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertX32x4F32x4) { constexpr auto AsmConvertX32F32 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %0.4s, %1.4s, #11"); __uint128_t arg = MakeUInt128(0x80000000ffff9852ULL, 0x0000110200001254ULL); ASSERT_EQ(AsmConvertX32F32(arg), MakeUInt128(0xc9800000c14f5c00ULL, 0x400810004012a000ULL)); } TEST(Arm64InsnTest, AsmConvertUX32F32Scalar) { constexpr auto AsmConvertUX32F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %s0, %w1, #7"); ASSERT_EQ(AsmConvertUX32F32(0x857), MakeUInt128(0x41857000ULL, 0U)); ASSERT_EQ(AsmConvertUX32F32(1U << 31), MakeUInt128(0x4b800000ULL, 0U)); // Test the default rounding behavior (FPRounding_TIEEVEN). ASSERT_EQ(AsmConvertUX32F32(0x80000080), MakeUInt128(0x4b800000ULL, 0U)); ASSERT_EQ(AsmConvertUX32F32(0x800000c0), MakeUInt128(0x4b800001ULL, 0U)); ASSERT_EQ(AsmConvertUX32F32(0x80000140), MakeUInt128(0x4b800001ULL, 0U)); ASSERT_EQ(AsmConvertUX32F32(0x80000180), MakeUInt128(0x4b800002ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertUX32F64Scalar) { constexpr auto AsmConvertUX32F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %d0, %w1, #8"); ASSERT_EQ(AsmConvertUX32F64(0x361), MakeUInt128(0x400b080000000000ULL, 0U)); ASSERT_EQ(AsmConvertUX32F64(1U << 31), MakeUInt128(0x4160000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertUX32F32) { constexpr auto AsmConvertUX32F32 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %s0, %s1, #7"); ASSERT_EQ(AsmConvertUX32F32(0x456), MakeUInt128(0x410ac000ULL, 0U)); ASSERT_EQ(AsmConvertUX32F32(1U << 31), MakeUInt128(0x4b800000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertUX32x4F32x4) { constexpr auto AsmConvertUX32F32 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %0.4s, %1.4s, #11"); __uint128_t arg = MakeUInt128(0x8000000000008023ULL, 0x0000201800001956ULL); ASSERT_EQ(AsmConvertUX32F32(arg), MakeUInt128(0x4980000041802300ULL, 0x40806000404ab000ULL)); } TEST(Arm64InsnTest, AsmConvertX64F32Scalar) { constexpr auto AsmConvertX64F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %s0, %x1, #10"); ASSERT_EQ(AsmConvertX64F32(0x2234), MakeUInt128(0x4108d000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertX64F64Scalar) { constexpr auto AsmConvertX64F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("scvtf %d0, %x1, #10"); ASSERT_EQ(AsmConvertX64F64(0x1324), MakeUInt128(0x4013240000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertUX64F32Scalar) { constexpr auto AsmConvertUX64F32 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %s0, %x1, #10"); ASSERT_EQ(AsmConvertUX64F32(0x5763), MakeUInt128(0x41aec600ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertUX64F64Scalar) { constexpr auto AsmConvertUX64F64 = ASM_INSN_WRAP_FUNC_W_RES_R_ARG("ucvtf %d0, %x1, #10"); ASSERT_EQ(AsmConvertUX64F64(0x2217), MakeUInt128(0x40210b8000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertX64F64) { constexpr auto AsmConvertX64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %d0, %d1, #12"); ASSERT_EQ(AsmConvertX64F64(0x723), MakeUInt128(0x3fdc8c0000000000ULL, 0U)); ASSERT_EQ(AsmConvertX64F64(1ULL << 63), MakeUInt128(0xc320000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertUX64F64) { constexpr auto AsmConvertUX64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %d0, %d1, #12"); ASSERT_EQ(AsmConvertUX64F64(0x416), MakeUInt128(0x3fd0580000000000ULL, 0U)); ASSERT_EQ(AsmConvertUX64F64(1ULL << 63), MakeUInt128(0x4320000000000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertUX64F64With64BitFraction) { constexpr auto AsmConvertUX64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %d0, %d1, #64"); ASSERT_EQ(AsmConvertUX64F64(1ULL << 63), MakeUInt128(0x3fe0'0000'0000'0000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertX64x2F64x2) { constexpr auto AsmConvertX64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("scvtf %0.2d, %1.2d, #12"); __uint128_t arg = MakeUInt128(1ULL << 63, 0x8086U); ASSERT_EQ(AsmConvertX64F64(arg), MakeUInt128(0xc320000000000000ULL, 0x402010c000000000ULL)); } TEST(Arm64InsnTest, AsmConvertUX64x2F64x2) { constexpr auto AsmConvertUX64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %0.2d, %1.2d, #12"); __uint128_t arg = MakeUInt128(1ULL << 63, 0x6809U); ASSERT_EQ(AsmConvertUX64F64(arg), MakeUInt128(0x4320000000000000ULL, 0x401a024000000000ULL)); } TEST(Arm64InsnTest, AsmConvertUX64x2F64x2With64BitFraction) { constexpr auto AsmConvertUX64F64 = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("ucvtf %0.2d, %1.2d, #64"); __uint128_t arg = MakeUInt128(0x7874'211c'b7aa'f597ULL, 0x2c0f'5504'd25e'f673ULL); ASSERT_EQ(AsmConvertUX64F64(arg), MakeUInt128(0x3fde'1d08'472d'eabdULL, 0x3fc6'07aa'8269'2f7bULL)); } TEST(Arm64InsnTest, AsmConvertF32X32Scalar) { constexpr auto AsmConvertF32X32 = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %w0, %s1, #16"); uint32_t arg1 = 0x4091eb85U; // 4.56 in float ASSERT_EQ(AsmConvertF32X32(arg1), MakeUInt128(0x00048f5cU, 0U)); uint32_t arg2 = 0xc0d80000U; // -6.75 in float ASSERT_EQ(AsmConvertF32X32(arg2), MakeUInt128(0xfff94000U, 0U)); ASSERT_EQ(AsmConvertF32X32(kDefaultNaN32AsInteger), MakeUInt128(bit_cast(0.0f), 0U)); } TEST(Arm64InsnTest, AsmConvertF32UX32Scalar) { constexpr auto AsmConvertF32UX32 = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %w0, %s1, #16"); uint32_t arg1 = 0x41223d71U; // 10.14 in float ASSERT_EQ(AsmConvertF32UX32(arg1), MakeUInt128(0x000a23d7U, 0U)); uint32_t arg2 = 0xc1540000U; // -13.25 in float ASSERT_EQ(AsmConvertF32UX32(arg2), MakeUInt128(0xfff2c000U, 0U)); ASSERT_EQ(AsmConvertF32UX32(kDefaultNaN32AsInteger), MakeUInt128(bit_cast(0.0f), 0U)); } TEST(Arm64InsnTest, AsmConvertF32UX32With31FractionalBits) { constexpr auto AsmConvertF32UX32 = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %w0, %s1, #31"); uint32_t arg1 = bit_cast(0.25f); ASSERT_EQ(AsmConvertF32UX32(arg1), MakeUInt128(0x20000000U, 0U)); } TEST(Arm64InsnTest, AsmConvertF64X32Scalar) { constexpr auto AsmConvertF64X32 = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %w0, %d1, #16"); uint64_t arg1 = 0x401e8f5c28f5c28fULL; // 7.46 in double ASSERT_EQ(AsmConvertF64X32(arg1), MakeUInt128(0x0007a3d7U, 0U)); uint64_t arg2 = 0xc040200000000000ULL; // -32.44 in double ASSERT_EQ(AsmConvertF64X32(arg2), MakeUInt128(0xffdfc000U, 0U)); } TEST(Arm64InsnTest, AsmConvertF32X64Scalar) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %x0, %s1, #16"); uint64_t arg1 = bit_cast(7.50f); ASSERT_EQ(AsmFcvtzs(arg1), MakeUInt128(0x0000000000078000ULL, 0ULL)); uint64_t arg2 = bit_cast(-6.50f); ASSERT_EQ(AsmFcvtzs(arg2), MakeUInt128(0xfffffffffff98000ULL, 0ULL)); } TEST(Arm64InsnTest, AsmConvertF32UX64With63FractionalBits) { constexpr auto AsmConvertF32UX64 = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %x0, %s1, #63"); uint32_t arg1 = bit_cast(0.25f); ASSERT_EQ(AsmConvertF32UX64(arg1), MakeUInt128(0x20000000'00000000ULL, 0U)); } TEST(Arm64InsnTest, AsmConvertF64X64Scalar) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzs %x0, %d1, #16"); uint64_t arg1 = bit_cast(7.50); ASSERT_EQ(AsmFcvtzs(arg1), MakeUInt128(0x0000000000078000ULL, 0ULL)); uint64_t arg2 = bit_cast(-6.50); ASSERT_EQ(AsmFcvtzs(arg2), MakeUInt128(0xfffffffffff98000ULL, 0ULL)); } TEST(Arm64InsnTest, AsmConvertF32X32x4) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzs %0.4s, %1.4s, #2"); __uint128_t res = AsmFcvtzs(MakeF32x4(-5.5f, -0.0f, 0.0f, 6.5f)); ASSERT_EQ(res, MakeUInt128(0x00000000ffffffeaULL, 0x0000001a00000000ULL)); } TEST(Arm64InsnTest, AsmConvertF64UX32Scalar) { constexpr auto AsmConvertF64UX32 = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %w0, %d1, #16"); uint64_t arg1 = 0x4020947ae147ae14ULL; // 8.29 in double ASSERT_EQ(AsmConvertF64UX32(arg1), MakeUInt128(0x00084a3dU, 0U)); uint64_t arg2 = 0xc023666666666666ULL; // -9.70 in double ASSERT_EQ(AsmConvertF64UX32(arg2), MakeUInt128(0U, 0U)); } TEST(Arm64InsnTest, AsmConvertF32UX64Scalar) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %x0, %s1, #16"); uint64_t arg1 = bit_cast(7.50f); ASSERT_EQ(AsmFcvtzu(arg1), MakeUInt128(0x0000000000078000ULL, 0ULL)); uint64_t arg2 = bit_cast(-6.50f); ASSERT_EQ(AsmFcvtzu(arg2), 0ULL); } TEST(Arm64InsnTest, AsmConvertF64UX64Scalar) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %x0, %d1, #16"); uint64_t arg1 = bit_cast(7.50); ASSERT_EQ(AsmFcvtzu(arg1), MakeUInt128(0x0000000000078000ULL, 0ULL)); uint64_t arg2 = bit_cast(-6.50); ASSERT_EQ(AsmFcvtzu(arg2), MakeUInt128(0ULL, 0ULL)); } TEST(Arm64InsnTest, AsmConvertF64UX64ScalarWith64BitFraction) { constexpr auto AsmFcvtzu = ASM_INSN_WRAP_FUNC_R_RES_W_ARG("fcvtzu %x0, %d1, #64"); uint64_t arg = bit_cast(0.625); ASSERT_EQ(AsmFcvtzu(arg), MakeUInt128(0xa000'0000'0000'0000ULL, 0ULL)); } TEST(Arm64InsnTest, AsmConvertF32UX32x4) { constexpr auto AsmFcvtzs = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("fcvtzu %0.4s, %1.4s, #2"); __uint128_t res = AsmFcvtzs(MakeF32x4(-5.5f, -0.0f, 0.0f, 6.5f)); ASSERT_EQ(res, MakeUInt128(0x0000000000000000ULL, 0x0000001a00000000ULL)); } TEST(Arm64InsnTest, Fp32ConditionalSelect) { uint64_t int_arg1 = 3; uint64_t int_arg2 = 7; uint64_t fp_arg1 = 0xfedcba9876543210ULL; uint64_t fp_arg2 = 0x0123456789abcdefULL; __uint128_t res; asm("cmp %x1,%x2\n\t" "fcsel %s0, %s3, %s4, eq" : "=w"(res) : "r"(int_arg1), "r"(int_arg2), "w"(fp_arg1), "w"(fp_arg2)); ASSERT_EQ(res, MakeUInt128(0x89abcdefULL, 0U)); asm("cmp %x1,%x2\n\t" "fcsel %s0, %s3, %s4, ne" : "=w"(res) : "r"(int_arg1), "r"(int_arg2), "w"(fp_arg1), "w"(fp_arg2)); ASSERT_EQ(res, MakeUInt128(0x76543210ULL, 0U)); } TEST(Arm64InsnTest, Fp64ConditionalSelect) { uint64_t int_arg1 = 8; uint64_t int_arg2 = 3; uint64_t fp_arg1 = 0xfedcba9876543210ULL; uint64_t fp_arg2 = 0x0123456789abcdefULL; __uint128_t res; asm("cmp %x1,%x2\n\t" "fcsel %d0, %d3, %d4, eq" : "=w"(res) : "r"(int_arg1), "r"(int_arg2), "w"(fp_arg1), "w"(fp_arg2)); ASSERT_EQ(res, MakeUInt128(0x0123456789abcdefULL, 0U)); asm("cmp %x1,%x2\n\t" "fcsel %d0, %d3, %d4, ne" : "=w"(res) : "r"(int_arg1), "r"(int_arg2), "w"(fp_arg1), "w"(fp_arg2)); ASSERT_EQ(res, MakeUInt128(0xfedcba9876543210ULL, 0U)); } TEST(Arm64InsnTest, RoundUpFp32) { // The lower 32-bit represents 2.7182817 in float. uint64_t fp_arg = 0xdeadbeef402df854ULL; __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintp %s0, %s1")(fp_arg); ASSERT_EQ(res, MakeUInt128(0x40400000ULL, 0U)); // 3.0 in float } TEST(Arm64InsnTest, RoundUpFp64) { // 2.7182817 in double. uint64_t fp_arg = 0x4005BF0A8B145769ULL; __uint128_t res = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintp %d0, %d1")(fp_arg); ASSERT_EQ(res, MakeUInt128(0x4008000000000000ULL, 0U)); // 3.0 in double } TEST(Arm64InsnTest, RoundToIntNearestTiesAwayFp64) { constexpr auto AsmFrinta = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frinta %d0, %d1"); // -7.50 -> -8.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0xc01E000000000000ULL), MakeUInt128(0xc020000000000000ULL, 0U)); // -6.75 -> -7.00 ASSERT_EQ(AsmFrinta(0xc01B000000000000ULL), MakeUInt128(0xc01c000000000000ULL, 0U)); // -6.50 -> -7.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0xc01A000000000000ULL), MakeUInt128(0xc01c000000000000ULL, 0U)); // -6.25 -> -6.00 ASSERT_EQ(AsmFrinta(0xc019000000000000ULL), MakeUInt128(0xc018000000000000ULL, 0U)); // 6.25 -> 6.00 ASSERT_EQ(AsmFrinta(0x4019000000000000ULL), MakeUInt128(0x4018000000000000ULL, 0U)); // 6.50 -> 7.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0x401A000000000000ULL), MakeUInt128(0x401c000000000000ULL, 0U)); // 6.75 -> 7.00 ASSERT_EQ(AsmFrinta(0x401B000000000000ULL), MakeUInt128(0x401c000000000000ULL, 0U)); // 7.50 -> 8.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0x401E000000000000ULL), MakeUInt128(0x4020000000000000ULL, 0U)); // -0.49999999999999994 -> -0.0 (should not "tie away" since -0.4999... != -0.5) ASSERT_EQ(AsmFrinta(0xBFDFFFFFFFFFFFFF), MakeUInt128(0x8000000000000000U, 0U)); // A number too large to have fractional precision, should not change upon rounding with tie-away ASSERT_EQ(AsmFrinta(bit_cast(0.5 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(0.5 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(-0.5 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(-0.5 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(0.75 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(0.75 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(-0.75 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(-0.75 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(1.0 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(1.0 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(-1.0 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(-1.0 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(2.0 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(2.0 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(-2.0 / std::numeric_limits::epsilon())), MakeUInt128(bit_cast(-2.0 / std::numeric_limits::epsilon()), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(1.0e100)), MakeUInt128(bit_cast(1.0e100), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(-1.0e100)), MakeUInt128(bit_cast(-1.0e100), 0U)); } TEST(Arm64InsnTest, RoundToIntNearestTiesAwayFp32) { constexpr auto AsmFrinta = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frinta %s0, %s1"); // -7.50 -> -8.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0xc0f00000U), MakeUInt128(0xc1000000U, 0U)); // -6.75 -> -7.00 ASSERT_EQ(AsmFrinta(0xc0d80000U), MakeUInt128(0xc0e00000U, 0U)); // -6.50 -> -7.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0xc0d00000U), MakeUInt128(0xc0e00000U, 0U)); // -6.25 -> -6.00 ASSERT_EQ(AsmFrinta(0xc0c80000U), MakeUInt128(0xc0c00000U, 0U)); // 6.25 -> 6.00 ASSERT_EQ(AsmFrinta(0x40c80000U), MakeUInt128(0x40c00000U, 0U)); // 6.50 -> 7.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0x40d00000U), MakeUInt128(0x40e00000U, 0U)); // 6.75 -> 7.00 ASSERT_EQ(AsmFrinta(0x40d80000U), MakeUInt128(0x40e00000U, 0U)); // 7.50 -> 8.00 (ties away from zero as opposted to even) ASSERT_EQ(AsmFrinta(0x40f00000U), MakeUInt128(0x41000000U, 0U)); // -0.49999997019767761 -> -0.0 (should not "tie away" since -0.4999... != -0.5) ASSERT_EQ(AsmFrinta(0xbeffffff), MakeUInt128(0x80000000U, 0U)); // A number too large to have fractional precision, should not change upon rounding with tie-away ASSERT_EQ( AsmFrinta(bit_cast(float{0.5 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{0.5 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ( AsmFrinta(bit_cast(float{-0.5 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{-0.5 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ( AsmFrinta(bit_cast(float{0.75 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{0.75 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ( AsmFrinta(bit_cast(float{-0.75 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{-0.75 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ( AsmFrinta(bit_cast(float{1.0 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{1.0 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ( AsmFrinta(bit_cast(float{-1.0 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{-1.0 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ( AsmFrinta(bit_cast(float{2.0 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{2.0 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ( AsmFrinta(bit_cast(float{-2.0 / std::numeric_limits::epsilon()})), MakeUInt128(bit_cast(float{-2.0 / std::numeric_limits::epsilon()}), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(1.0e38f)), MakeUInt128(bit_cast(1.0e38f), 0U)); ASSERT_EQ(AsmFrinta(bit_cast(-1.0e38f)), MakeUInt128(bit_cast(-1.0e38f), 0U)); } TEST(Arm64InsnTest, RoundToIntDownwardFp64) { constexpr auto AsmFrintm = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintm %d0, %d1"); // 7.7 -> 7.00 ASSERT_EQ(AsmFrintm(0x401ecccccccccccdULL), MakeUInt128(0x401c000000000000, 0U)); // 7.1 -> 7.00 ASSERT_EQ(AsmFrintm(0x401c666666666666ULL), MakeUInt128(0x401c000000000000, 0U)); // -7.10 -> -8.00 ASSERT_EQ(AsmFrintm(0xc01c666666666666ULL), MakeUInt128(0xc020000000000000, 0U)); // -7.90 -> -8.00 ASSERT_EQ(AsmFrintm(0xc01f99999999999aULL), MakeUInt128(0xc020000000000000, 0U)); // 0 -> 0 ASSERT_EQ(AsmFrintm(0x0000000000000000ULL), MakeUInt128(0x0000000000000000, 0U)); // -0 -> -0 ASSERT_EQ(AsmFrintm(0x8000000000000000ULL), MakeUInt128(0x8000000000000000, 0U)); } TEST(Arm64InsnTest, RoundToIntDownwardFp32) { constexpr auto AsmFrintm = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintm %s0, %s1"); // 7.7 -> 7.00 ASSERT_EQ(AsmFrintm(0x40f66666), 0x40e00000); // 7.1 -> 7.00 ASSERT_EQ(AsmFrintm(0x40e33333), 0x40e00000); // -7.10 -> -8.00 ASSERT_EQ(AsmFrintm(0xc0e33333), 0xc1000000); // -7.90 -> -8.00 ASSERT_EQ(AsmFrintm(0xc0fccccd), 0xc1000000); // 0 -> 0 ASSERT_EQ(AsmFrintm(0x00000000), 0x00000000); // -0 -> -0 ASSERT_EQ(AsmFrintm(0x80000000), 0x80000000); } TEST(Arm64InsnTest, RoundToIntNearestFp64) { constexpr auto AsmFrintn = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintn %d0, %d1"); // 7.5 -> 8.00 (ties to even) ASSERT_EQ(AsmFrintn(0x401e000000000000ULL), MakeUInt128(0x4020000000000000, 0U)); // 8.5 -> 8.00 (ties to even) ASSERT_EQ(AsmFrintn(0x4021000000000000), MakeUInt128(0x4020000000000000, 0U)); // 7.10 -> 7.00 ASSERT_EQ(AsmFrintn(0x401c666666666666), MakeUInt128(0x401c000000000000, 0U)); // 7.90 -> 8.00 ASSERT_EQ(AsmFrintn(0x401f99999999999a), MakeUInt128(0x4020000000000000, 0U)); // -7.5 -> -8.00 (ties to even) ASSERT_EQ(AsmFrintn(0xc01e000000000000), MakeUInt128(0xc020000000000000, 0U)); // // -8.5 -> -8.00 (ties to even) ASSERT_EQ(AsmFrintn(0xc021000000000000), MakeUInt128(0xc020000000000000, 0U)); // -7.10 -> -7.00 ASSERT_EQ(AsmFrintn(0xc01c666666666666), MakeUInt128(0xc01c000000000000, 0U)); // -7.90 -> -8.00 ASSERT_EQ(AsmFrintn(0xc01f99999999999a), MakeUInt128(0xc020000000000000, 0U)); // 0 -> 0 ASSERT_EQ(AsmFrintn(0x0000000000000000ULL), MakeUInt128(0x0000000000000000, 0U)); // -0 -> -0 ASSERT_EQ(AsmFrintn(0x8000000000000000ULL), MakeUInt128(0x8000000000000000, 0U)); } TEST(Arm64InsnTest, RoundToIntToNearestFp32) { constexpr auto AsmFrintn = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintn %s0, %s1"); // 7.5 -> 8.00 (ties to even) ASSERT_EQ(AsmFrintn(0x40f00000), 0x41000000); // 8.5 -> 8.00 (ties to even) ASSERT_EQ(AsmFrintn(0x41080000), 0x41000000); // 7.10 -> 7.00 ASSERT_EQ(AsmFrintn(0x40e33333), 0x40e00000); // 7.90 -> 8.00 ASSERT_EQ(AsmFrintn(0x40fccccd), 0x41000000); // -7.5 -> -8.00 (ties to even) ASSERT_EQ(AsmFrintn(0xc0f00000), 0xc1000000); // -8.5 -> -8.00 (ties to even) ASSERT_EQ(AsmFrintn(0xc1080000), 0xc1000000); // -7.10 -> -7.00 ASSERT_EQ(AsmFrintn(0xc0e33333), 0xc0e00000); // -7.90 -> -8.00 ASSERT_EQ(AsmFrintn(0xc0fccccd), 0xc1000000); // 0 -> 0 ASSERT_EQ(AsmFrintn(0x00000000), 0x00000000); // -0 -> -0 ASSERT_EQ(AsmFrintn(0x80000000), 0x80000000); } TEST(Arm64InsnTest, RoundToIntTowardZeroFp64) { constexpr auto AsmFrintz = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintz %d0, %d1"); // 7.7 -> 7.00 ASSERT_EQ(AsmFrintz(0x401ecccccccccccdULL), MakeUInt128(0x401c000000000000, 0U)); // 7.1 -> 7.00 ASSERT_EQ(AsmFrintz(0x401c666666666666ULL), MakeUInt128(0x401c000000000000, 0U)); // -7.10 -> -7.00 ASSERT_EQ(AsmFrintz(0xc01c666666666666ULL), MakeUInt128(0xc01c000000000000, 0U)); // -7.90 -> -7.00 ASSERT_EQ(AsmFrintz(0xc01f99999999999aULL), MakeUInt128(0xc01c000000000000, 0U)); // 0 -> 0 ASSERT_EQ(AsmFrintz(0x0000000000000000ULL), MakeUInt128(0x0000000000000000, 0U)); // -0 -> -0 ASSERT_EQ(AsmFrintz(0x8000000000000000ULL), MakeUInt128(0x8000000000000000, 0U)); } TEST(Arm64InsnTest, RoundToIntTowardZeroFp32) { constexpr auto AsmFrintz = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintz %s0, %s1"); // 7.7 -> 7.00 ASSERT_EQ(AsmFrintz(0x40f66666), 0x40e00000); // 7.1 -> 7.00 ASSERT_EQ(AsmFrintz(0x40e33333), 0x40e00000); // -7.10 -> -7.00 ASSERT_EQ(AsmFrintz(0xc0e33333), 0xc0e00000); // -7.90 -> -7.00 ASSERT_EQ(AsmFrintz(0xc0fccccd), 0xc0e00000); // 0 -> 0 ASSERT_EQ(AsmFrintz(0x00000000), 0x00000000); // -0 -> -0 ASSERT_EQ(AsmFrintz(0x80000000), 0x80000000); } TEST(Arm64InsnTest, AsmConvertF32x4TieAway) { constexpr auto AsmFcvta = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frinta %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvta(arg1), MakeF32x4(-8.00f, -7.00f, -7.00f, -6.00f)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvta(arg2), MakeF32x4(6.00f, 7.00f, 7.00f, 8.00f)); } TEST(Arm64InsnTest, AsmConvertF32x4NegInf) { constexpr auto AsmFcvtm = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintm %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtm(arg1), MakeF32x4(-8.00f, -7.00f, -7.00f, -7.00f)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtm(arg2), MakeF32x4(6.00f, 6.00f, 6.00f, 7.00f)); } TEST(Arm64InsnTest, AsmConvertF32x4TieEven) { constexpr auto AsmFcvtn = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintn %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtn(arg1), MakeF32x4(-8.00f, -7.00f, -6.00f, -6.00f)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtn(arg2), MakeF32x4(6.00f, 6.00f, 7.00f, 8.00f)); } TEST(Arm64InsnTest, AsmConvertF32x4PosInf) { constexpr auto AsmFcvtp = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintp %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtp(arg1), MakeF32x4(-7.00f, -6.00f, -6.00f, -6.00f)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtp(arg2), MakeF32x4(7.00f, 7.00f, 7.00f, 8.00f)); } TEST(Arm64InsnTest, AsmConvertF32x4Truncate) { constexpr auto AsmFcvtz = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintz %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFcvtz(arg1), MakeF32x4(-7.00f, -6.00f, -6.00f, -6.00f)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFcvtz(arg2), MakeF32x4(6.00f, 6.00f, 6.00f, 7.00f)); } TEST(Arm64InsnTest, AsmConvertF64x4TieAway) { constexpr auto AsmFcvta = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frinta %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvta(arg1), MakeF64x2(-8.00, -7.00)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvta(arg2), MakeF64x2(-7.00, -6.00)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvta(arg3), MakeF64x2(6.00, 7.00)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvta(arg4), MakeF64x2(7.00, 8.00)); } TEST(Arm64InsnTest, AsmConvertF64x4NegInf) { constexpr auto AsmFcvtm = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintm %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtm(arg1), MakeF64x2(-8.00, -7.00)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtm(arg2), MakeF64x2(-7.00, -7.00)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtm(arg3), MakeF64x2(6.00, 6.00)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtm(arg4), MakeF64x2(6.00, 7.00)); } TEST(Arm64InsnTest, AsmConvertF64x4TieEven) { constexpr auto AsmFcvtn = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintn %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtn(arg1), MakeF64x2(-8.00, -7.00)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtn(arg2), MakeF64x2(-6.00, -6.00)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtn(arg3), MakeF64x2(6.00, 6.00)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtn(arg4), MakeF64x2(7.00, 8.00)); } TEST(Arm64InsnTest, AsmConvertF64x4PosInf) { constexpr auto AsmFcvtp = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintp %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtp(arg1), MakeF64x2(-7.00, -6.00)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtp(arg2), MakeF64x2(-6.00, -6.00)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtp(arg3), MakeF64x2(7.00, 7.00)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtp(arg4), MakeF64x2(7.00, 8.00)); } TEST(Arm64InsnTest, AsmConvertF64x4Truncate) { constexpr auto AsmFcvtz = ASM_INSN_WRAP_FUNC_W_RES_W_ARG("frintz %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFcvtz(arg1), MakeF64x2(-7.00, -6.00)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFcvtz(arg2), MakeF64x2(-6.00, -6.00)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFcvtz(arg3), MakeF64x2(6.00, 6.00)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFcvtz(arg4), MakeF64x2(6.00, 7.00)); } TEST(Arm64InsnTest, AsmRoundCurrentModeF32) { constexpr auto AsmFrinti = ASM_INSN_WRAP_FUNC_W_RES_WC_ARG("frinti %s0, %s1"); ASSERT_EQ(AsmFrinti(bit_cast(-7.50f), kFpcrRModeTieEven), bit_cast(-8.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75f), kFpcrRModeTieEven), bit_cast(-7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50f), kFpcrRModeTieEven), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25f), kFpcrRModeTieEven), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.25f), kFpcrRModeTieEven), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.50f), kFpcrRModeTieEven), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.75f), kFpcrRModeTieEven), bit_cast(7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(7.50f), kFpcrRModeTieEven), bit_cast(8.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-7.50f), kFpcrRModeNegInf), bit_cast(-8.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75f), kFpcrRModeNegInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50f), kFpcrRModeNegInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25f), kFpcrRModeNegInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.25f), kFpcrRModeNegInf), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.50f), kFpcrRModeNegInf), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.75f), kFpcrRModeNegInf), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(7.50f), kFpcrRModeNegInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-7.50f), kFpcrRModePosInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75f), kFpcrRModePosInf), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50f), kFpcrRModePosInf), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25f), kFpcrRModePosInf), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.25f), kFpcrRModePosInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.50f), kFpcrRModePosInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.75f), kFpcrRModePosInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(7.50f), kFpcrRModePosInf), bit_cast(8.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-7.50f), kFpcrRModeZero), bit_cast(-7.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75f), kFpcrRModeZero), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50f), kFpcrRModeZero), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25f), kFpcrRModeZero), bit_cast(-6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.25f), kFpcrRModeZero), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.50f), kFpcrRModeZero), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(6.75f), kFpcrRModeZero), bit_cast(6.00f)); ASSERT_EQ(AsmFrinti(bit_cast(7.50f), kFpcrRModeZero), bit_cast(7.00f)); } TEST(Arm64InsnTest, AsmRoundCurrentModeF64) { constexpr auto AsmFrinti = ASM_INSN_WRAP_FUNC_W_RES_WC_ARG("frinti %d0, %d1"); ASSERT_EQ(AsmFrinti(bit_cast(-7.50), kFpcrRModeTieEven), bit_cast(-8.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75), kFpcrRModeTieEven), bit_cast(-7.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50), kFpcrRModeTieEven), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25), kFpcrRModeTieEven), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.25), kFpcrRModeTieEven), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.50), kFpcrRModeTieEven), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.75), kFpcrRModeTieEven), bit_cast(7.00)); ASSERT_EQ(AsmFrinti(bit_cast(7.50), kFpcrRModeTieEven), bit_cast(8.00)); ASSERT_EQ(AsmFrinti(bit_cast(-7.50), kFpcrRModeNegInf), bit_cast(-8.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75), kFpcrRModeNegInf), bit_cast(-7.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50), kFpcrRModeNegInf), bit_cast(-7.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25), kFpcrRModeNegInf), bit_cast(-7.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.25), kFpcrRModeNegInf), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.50), kFpcrRModeNegInf), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.75), kFpcrRModeNegInf), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(7.50), kFpcrRModeNegInf), bit_cast(7.00)); ASSERT_EQ(AsmFrinti(bit_cast(-7.50), kFpcrRModePosInf), bit_cast(-7.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75), kFpcrRModePosInf), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50), kFpcrRModePosInf), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25), kFpcrRModePosInf), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.25), kFpcrRModePosInf), bit_cast(7.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.50), kFpcrRModePosInf), bit_cast(7.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.75), kFpcrRModePosInf), bit_cast(7.00)); ASSERT_EQ(AsmFrinti(bit_cast(7.50), kFpcrRModePosInf), bit_cast(8.00)); ASSERT_EQ(AsmFrinti(bit_cast(-7.50), kFpcrRModeZero), bit_cast(-7.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.75), kFpcrRModeZero), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.50), kFpcrRModeZero), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(-6.25), kFpcrRModeZero), bit_cast(-6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.25), kFpcrRModeZero), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.50), kFpcrRModeZero), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(6.75), kFpcrRModeZero), bit_cast(6.00)); ASSERT_EQ(AsmFrinti(bit_cast(7.50), kFpcrRModeZero), bit_cast(7.00)); } TEST(Arm64InsnTest, AsmRoundCurrentModeF32x4) { constexpr auto AsmFrinti = ASM_INSN_WRAP_FUNC_W_RES_WC_ARG("frinti %0.4s, %1.4s"); __uint128_t arg1 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFrinti(arg1, kFpcrRModeTieEven), MakeF32x4(-8.00f, -7.00f, -6.00f, -6.00f)); __uint128_t arg2 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFrinti(arg2, kFpcrRModeTieEven), MakeF32x4(6.00f, 6.00f, 7.00f, 8.00f)); __uint128_t arg3 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFrinti(arg3, kFpcrRModeNegInf), MakeF32x4(-8.00f, -7.00f, -7.00f, -7.00f)); __uint128_t arg4 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFrinti(arg4, kFpcrRModeNegInf), MakeF32x4(6.00f, 6.00f, 6.00f, 7.00f)); __uint128_t arg5 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFrinti(arg5, kFpcrRModePosInf), MakeF32x4(-7.00f, -6.00f, -6.00f, -6.00f)); __uint128_t arg6 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFrinti(arg6, kFpcrRModePosInf), MakeF32x4(7.00f, 7.00f, 7.00f, 8.00f)); __uint128_t arg7 = MakeF32x4(-7.50f, -6.75f, -6.50f, -6.25f); ASSERT_EQ(AsmFrinti(arg7, kFpcrRModeZero), MakeF32x4(-7.00f, -6.00f, -6.00f, -6.00f)); __uint128_t arg8 = MakeF32x4(6.25f, 6.50f, 6.75f, 7.50f); ASSERT_EQ(AsmFrinti(arg8, kFpcrRModeZero), MakeF32x4(6.00f, 6.00f, 6.00f, 7.00f)); } TEST(Arm64InsnTest, AsmRoundCurrentModeF64x2) { constexpr auto AsmFrinti = ASM_INSN_WRAP_FUNC_W_RES_WC_ARG("frinti %0.2d, %1.2d"); __uint128_t arg1 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFrinti(arg1, kFpcrRModeTieEven), MakeF64x2(-8.00, -7.00)); __uint128_t arg2 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFrinti(arg2, kFpcrRModeTieEven), MakeF64x2(-6.00, -6.00)); __uint128_t arg3 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFrinti(arg3, kFpcrRModeTieEven), MakeF64x2(6.00, 6.00)); __uint128_t arg4 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFrinti(arg4, kFpcrRModeTieEven), MakeF64x2(7.00, 8.00)); __uint128_t arg5 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFrinti(arg5, kFpcrRModeNegInf), MakeF64x2(-8.00, -7.00)); __uint128_t arg6 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFrinti(arg6, kFpcrRModeNegInf), MakeF64x2(-7.00, -7.00)); __uint128_t arg7 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFrinti(arg7, kFpcrRModeNegInf), MakeF64x2(6.00, 6.00)); __uint128_t arg8 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFrinti(arg8, kFpcrRModeNegInf), MakeF64x2(6.00, 7.00)); __uint128_t arg9 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFrinti(arg9, kFpcrRModePosInf), MakeF64x2(-7.00, -6.00)); __uint128_t arg10 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFrinti(arg10, kFpcrRModePosInf), MakeF64x2(-6.00, -6.00)); __uint128_t arg11 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFrinti(arg11, kFpcrRModePosInf), MakeF64x2(7.00, 7.00)); __uint128_t arg12 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFrinti(arg12, kFpcrRModePosInf), MakeF64x2(7.00, 8.00)); __uint128_t arg13 = MakeF64x2(-7.50, -6.75); ASSERT_EQ(AsmFrinti(arg13, kFpcrRModeZero), MakeF64x2(-7.00, -6.00)); __uint128_t arg14 = MakeF64x2(-6.50, -6.25); ASSERT_EQ(AsmFrinti(arg14, kFpcrRModeZero), MakeF64x2(-6.00, -6.00)); __uint128_t arg15 = MakeF64x2(6.25, 6.50); ASSERT_EQ(AsmFrinti(arg15, kFpcrRModeZero), MakeF64x2(6.00, 6.00)); __uint128_t arg16 = MakeF64x2(6.75, 7.50); ASSERT_EQ(AsmFrinti(arg16, kFpcrRModeZero), MakeF64x2(6.00, 7.00)); } TEST(Arm64InsnTest, AsmRoundExactF32) { constexpr auto AsmFrintx = ASM_INSN_WRAP_FUNC_W_RES_WC_ARG("frintx %s0, %s1"); ASSERT_EQ(AsmFrintx(bit_cast(-7.50f), kFpcrRModeTieEven), bit_cast(-8.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.75f), kFpcrRModeTieEven), bit_cast(-7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.50f), kFpcrRModeTieEven), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.25f), kFpcrRModeTieEven), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.25f), kFpcrRModeTieEven), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.50f), kFpcrRModeTieEven), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.75f), kFpcrRModeTieEven), bit_cast(7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(7.50f), kFpcrRModeTieEven), bit_cast(8.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-7.50f), kFpcrRModeNegInf), bit_cast(-8.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.75f), kFpcrRModeNegInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.50f), kFpcrRModeNegInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.25f), kFpcrRModeNegInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.25f), kFpcrRModeNegInf), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.50f), kFpcrRModeNegInf), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.75f), kFpcrRModeNegInf), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(7.50f), kFpcrRModeNegInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-7.50f), kFpcrRModePosInf), bit_cast(-7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.75f), kFpcrRModePosInf), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.50f), kFpcrRModePosInf), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.25f), kFpcrRModePosInf), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.25f), kFpcrRModePosInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.50f), kFpcrRModePosInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.75f), kFpcrRModePosInf), bit_cast(7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(7.50f), kFpcrRModePosInf), bit_cast(8.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-7.50f), kFpcrRModeZero), bit_cast(-7.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.75f), kFpcrRModeZero), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.50f), kFpcrRModeZero), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(-6.25f), kFpcrRModeZero), bit_cast(-6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.25f), kFpcrRModeZero), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.50f), kFpcrRModeZero), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(6.75f), kFpcrRModeZero), bit_cast(6.00f)); ASSERT_EQ(AsmFrintx(bit_cast(7.50f), kFpcrRModeZero), bit_cast(7.00f)); } TEST(Arm64InsnTest, AsmRoundExactF64) { constexpr auto AsmFrintx = ASM_INSN_WRAP_FUNC_W_RES_WC_ARG("frintx %d0, %d1"); ASSERT_EQ(AsmFrintx(bit_cast(-7.50), kFpcrRModeTieEven), bit_cast(-8.00)); ASSERT_EQ(AsmFrintx(bit_cast(-6.75), kFpcrRModeTieEven), bit_cast(-7.00)); ASSERT_EQ(AsmFrintx(bit_cast(-6.50), kFpcrRModeTieEven), bit_cast(-6.00)); ASSERT_EQ(AsmFrintx(bit_cast(-6.25), kFpcrRModeTieEven), bit_cast(-6.00)); ASSERT_EQ(AsmFrintx(bit_cast(6.25), kFpcrRModeTieEven), bit_cast(6.00)); ASSERT_EQ(AsmFrintx(bit_cast(6.50), kFpcrRModeTieEven), bit_cast(6.00)); ASSERT_EQ(AsmFrintx(bit_cast(6.75), kFpcrRModeTieEven), bit_cast(7.00)); ASSERT_EQ(AsmFrintx(bit_cast(7.50), kFpcrRModeTieEven), bit_cast(8.00)); ASSERT_EQ(AsmFrintx(bit_cast(-7.50), kFpcrRModeNegInf), bit_cast(-8.00)); ASSERT_EQ(AsmFrintx(bit_cast(-6.75), kFpcrRModeNegInf), bit_cast(-7.00)); ASSERT_EQ(AsmFrintx(bit_cast(-6.50), kFpcrRModeNegInf), bit_cast