1; RUN: opt -S %s -atomic-expand | FileCheck %s 2 3;; Verify the cmpxchg and atomicrmw expansions where sub-word-size 4;; instructions are not available. 5 6;;; NOTE: this test is mostly target-independent -- any target which 7;;; doesn't support cmpxchg of sub-word sizes would do. 8target datalayout = "E-m:e-i64:64-n32:64-S128" 9target triple = "sparcv9-unknown-unknown" 10 11; CHECK-LABEL: @test_cmpxchg_i8( 12; CHECK: fence seq_cst 13; CHECK: %0 = ptrtoint i8* %arg to i64 14; CHECK: %1 = and i64 %0, -4 15; CHECK: %AlignedAddr = inttoptr i64 %1 to i32* 16; CHECK: %PtrLSB = and i64 %0, 3 17; CHECK: %2 = xor i64 %PtrLSB, 3 18; CHECK: %3 = shl i64 %2, 3 19; CHECK: %ShiftAmt = trunc i64 %3 to i32 20; CHECK: %Mask = shl i32 255, %ShiftAmt 21; CHECK: %Inv_Mask = xor i32 %Mask, -1 22; CHECK: %4 = zext i8 %new to i32 23; CHECK: %5 = shl i32 %4, %ShiftAmt 24; CHECK: %6 = zext i8 %old to i32 25; CHECK: %7 = shl i32 %6, %ShiftAmt 26; CHECK: %8 = load i32, i32* %AlignedAddr 27; CHECK: %9 = and i32 %8, %Inv_Mask 28; CHECK: br label %partword.cmpxchg.loop 29; CHECK:partword.cmpxchg.loop: 30; CHECK: %10 = phi i32 [ %9, %entry ], [ %16, %partword.cmpxchg.failure ] 31; CHECK: %11 = or i32 %10, %5 32; CHECK: %12 = or i32 %10, %7 33; CHECK: %13 = cmpxchg i32* %AlignedAddr, i32 %12, i32 %11 monotonic monotonic 34; CHECK: %14 = extractvalue { i32, i1 } %13, 0 35; CHECK: %15 = extractvalue { i32, i1 } %13, 1 36; CHECK: br i1 %15, label %partword.cmpxchg.end, label %partword.cmpxchg.failure 37; CHECK:partword.cmpxchg.failure: 38; CHECK: %16 = and i32 %14, %Inv_Mask 39; CHECK: %17 = icmp ne i32 %10, %16 40; CHECK: br i1 %17, label %partword.cmpxchg.loop, label %partword.cmpxchg.end 41; CHECK:partword.cmpxchg.end: 42; CHECK: %18 = lshr i32 %14, %ShiftAmt 43; CHECK: %19 = trunc i32 %18 to i8 44; CHECK: %20 = insertvalue { i8, i1 } undef, i8 %19, 0 45; CHECK: %21 = insertvalue { i8, i1 } %20, i1 %15, 1 46; CHECK: fence seq_cst 47; CHECK: %ret = extractvalue { i8, i1 } %21, 0 48; CHECK: ret i8 %ret 49define i8 @test_cmpxchg_i8(i8* %arg, i8 %old, i8 %new) { 50entry: 51 %ret_succ = cmpxchg i8* %arg, i8 %old, i8 %new seq_cst monotonic 52 %ret = extractvalue { i8, i1 } %ret_succ, 0 53 ret i8 %ret 54} 55 56; CHECK-LABEL: @test_cmpxchg_i16( 57; CHECK: fence seq_cst 58; CHECK: %0 = ptrtoint i16* %arg to i64 59; CHECK: %1 = and i64 %0, -4 60; CHECK: %AlignedAddr = inttoptr i64 %1 to i32* 61; CHECK: %PtrLSB = and i64 %0, 3 62; CHECK: %2 = xor i64 %PtrLSB, 2 63; CHECK: %3 = shl i64 %2, 3 64; CHECK: %ShiftAmt = trunc i64 %3 to i32 65; CHECK: %Mask = shl i32 65535, %ShiftAmt 66; CHECK: %Inv_Mask = xor i32 %Mask, -1 67; CHECK: %4 = zext i16 %new to i32 68; CHECK: %5 = shl i32 %4, %ShiftAmt 69; CHECK: %6 = zext i16 %old to i32 70; CHECK: %7 = shl i32 %6, %ShiftAmt 71; CHECK: %8 = load i32, i32* %AlignedAddr 72; CHECK: %9 = and i32 %8, %Inv_Mask 73; CHECK: br label %partword.cmpxchg.loop 74; CHECK:partword.cmpxchg.loop: 75; CHECK: %10 = phi i32 [ %9, %entry ], [ %16, %partword.cmpxchg.failure ] 76; CHECK: %11 = or i32 %10, %5 77; CHECK: %12 = or i32 %10, %7 78; CHECK: %13 = cmpxchg i32* %AlignedAddr, i32 %12, i32 %11 monotonic monotonic 79; CHECK: %14 = extractvalue { i32, i1 } %13, 0 80; CHECK: %15 = extractvalue { i32, i1 } %13, 1 81; CHECK: br i1 %15, label %partword.cmpxchg.end, label %partword.cmpxchg.failure 82; CHECK:partword.cmpxchg.failure: 83; CHECK: %16 = and i32 %14, %Inv_Mask 84; CHECK: %17 = icmp ne i32 %10, %16 85; CHECK: br i1 %17, label %partword.cmpxchg.loop, label %partword.cmpxchg.end 86; CHECK:partword.cmpxchg.end: 87; CHECK: %18 = lshr i32 %14, %ShiftAmt 88; CHECK: %19 = trunc i32 %18 to i16 89; CHECK: %20 = insertvalue { i16, i1 } undef, i16 %19, 0 90; CHECK: %21 = insertvalue { i16, i1 } %20, i1 %15, 1 91; CHECK: fence seq_cst 92; CHECK: %ret = extractvalue { i16, i1 } %21, 0 93; CHECK: ret i16 %ret 94define i16 @test_cmpxchg_i16(i16* %arg, i16 %old, i16 %new) { 95entry: 96 %ret_succ = cmpxchg i16* %arg, i16 %old, i16 %new seq_cst monotonic 97 %ret = extractvalue { i16, i1 } %ret_succ, 0 98 ret i16 %ret 99} 100 101 102; CHECK-LABEL: @test_add_i16( 103; CHECK: fence seq_cst 104; CHECK: %0 = ptrtoint i16* %arg to i64 105; CHECK: %1 = and i64 %0, -4 106; CHECK: %AlignedAddr = inttoptr i64 %1 to i32* 107; CHECK: %PtrLSB = and i64 %0, 3 108; CHECK: %2 = xor i64 %PtrLSB, 2 109; CHECK: %3 = shl i64 %2, 3 110; CHECK: %ShiftAmt = trunc i64 %3 to i32 111; CHECK: %Mask = shl i32 65535, %ShiftAmt 112; CHECK: %Inv_Mask = xor i32 %Mask, -1 113; CHECK: %4 = zext i16 %val to i32 114; CHECK: %ValOperand_Shifted = shl i32 %4, %ShiftAmt 115; CHECK: %5 = load i32, i32* %AlignedAddr, align 4 116; CHECK: br label %atomicrmw.start 117; CHECK:atomicrmw.start: 118; CHECK: %loaded = phi i32 [ %5, %entry ], [ %newloaded, %atomicrmw.start ] 119; CHECK: %new = add i32 %loaded, %ValOperand_Shifted 120; CHECK: %6 = and i32 %new, %Mask 121; CHECK: %7 = and i32 %loaded, %Inv_Mask 122; CHECK: %8 = or i32 %7, %6 123; CHECK: %9 = cmpxchg i32* %AlignedAddr, i32 %loaded, i32 %8 monotonic monotonic 124; CHECK: %success = extractvalue { i32, i1 } %9, 1 125; CHECK: %newloaded = extractvalue { i32, i1 } %9, 0 126; CHECK: br i1 %success, label %atomicrmw.end, label %atomicrmw.start 127; CHECK:atomicrmw.end: 128; CHECK: %10 = lshr i32 %newloaded, %ShiftAmt 129; CHECK: %11 = trunc i32 %10 to i16 130; CHECK: fence seq_cst 131; CHECK: ret i16 %11 132define i16 @test_add_i16(i16* %arg, i16 %val) { 133entry: 134 %ret = atomicrmw add i16* %arg, i16 %val seq_cst 135 ret i16 %ret 136} 137 138; CHECK-LABEL: @test_xor_i16( 139; (I'm going to just assert on the bits that differ from add, above.) 140; CHECK:atomicrmw.start: 141; CHECK: %new = xor i32 %loaded, %ValOperand_Shifted 142; CHECK: %6 = cmpxchg i32* %AlignedAddr, i32 %loaded, i32 %new monotonic monotonic 143; CHECK:atomicrmw.end: 144define i16 @test_xor_i16(i16* %arg, i16 %val) { 145entry: 146 %ret = atomicrmw xor i16* %arg, i16 %val seq_cst 147 ret i16 %ret 148} 149 150; CHECK-LABEL: @test_min_i16( 151; CHECK:atomicrmw.start: 152; CHECK: %6 = lshr i32 %loaded, %ShiftAmt 153; CHECK: %7 = trunc i32 %6 to i16 154; CHECK: %8 = icmp sle i16 %7, %val 155; CHECK: %new = select i1 %8, i16 %7, i16 %val 156; CHECK: %9 = zext i16 %new to i32 157; CHECK: %10 = shl i32 %9, %ShiftAmt 158; CHECK: %11 = and i32 %loaded, %Inv_Mask 159; CHECK: %12 = or i32 %11, %10 160; CHECK: %13 = cmpxchg i32* %AlignedAddr, i32 %loaded, i32 %12 monotonic monotonic 161; CHECK:atomicrmw.end: 162define i16 @test_min_i16(i16* %arg, i16 %val) { 163entry: 164 %ret = atomicrmw min i16* %arg, i16 %val seq_cst 165 ret i16 %ret 166} 167