Searched refs:SSE41 (Results 1 – 25 of 30) sorted by relevance
12
3 …-unknown-unknown -mcpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE418 … %s -mtriple=i686-unknown-unknown -mcpu=i686 -mattr=+sse4.1 | FileCheck %s --check-prefix=X32-SSE4135 ; SSE41-LABEL: sext_8i16_to_8i32:36 ; SSE41: # BB#0: # %entry37 ; SSE41-NEXT: movdqa %xmm0, %xmm138 ; SSE41-NEXT: pmovzxwd %xmm1, %xmm039 ; SSE41-NEXT: pslld $16, %xmm040 ; SSE41-NEXT: psrad $16, %xmm041 ; SSE41-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]42 ; SSE41-NEXT: pslld $16, %xmm1[all …]
1 ; RUN: llc -march=x86-64 -mcpu=core2 -mattr=+sse4.1 < %s | FileCheck %s --check-prefix=SSE418 ; SSE41-LABEL: test1:9 ; SSE41: # BB#0:10 ; SSE41-NEXT: movdqa {{.*#+}} xmm1 = [613566757,613566757,613566757,613566757]11 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]12 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]13 ; SSE41-NEXT: pmuludq %xmm2, %xmm314 ; SSE41-NEXT: pmuludq %xmm0, %xmm115 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]16 ; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7][all …]
1 …N: llc -mtriple=x86_64-unknown-unknown -mattr=+sse4.1,-avx < %s | FileCheck %s --check-prefix SSE4114 ; SSE41: veccond12815 ; SSE41: ptest16 ; SSE41: ret32 ; SSE41: veccond25633 ; SSE41: por34 ; SSE41: ptest35 ; SSE41: ret51 ; SSE41: veccond51252 ; SSE41: por[all …]
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE4111 ; SSE41-LABEL: test1:12 ; SSE41: # BB#0:13 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]14 ; SSE41-NEXT: retq25 ; SSE41-LABEL: test2:26 ; SSE41: # BB#0:27 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]28 ; SSE41-NEXT: retq40 ; SSE41-LABEL: test3:[all …]
3 … %s -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE4122 ; SSE41-LABEL: vsel_float:23 ; SSE41: # BB#0: # %entry24 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]25 ; SSE41-NEXT: retq49 ; SSE41-LABEL: vsel_float2:50 ; SSE41: # BB#0: # %entry51 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3]52 ; SSE41-NEXT: retq76 ; SSE41-LABEL: vsel_4xi8:[all …]
3 …cpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE4148 ; SSE41-LABEL: shuffle_v8i16_456789AB:49 ; SSE41: # BB#0:50 ; SSE41-NEXT: palignr {{.*#+}} xmm1 = xmm0[8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5,6,7]51 ; SSE41-NEXT: movdqa %xmm1, %xmm052 ; SSE41-NEXT: retq75 ; SSE41-LABEL: shuffle_v8i16_00000000:76 ; SSE41: # BB#0:77 ; SSE41-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1]78 ; SSE41-NEXT: retq[all …]
3 …-unknown-unknown -mcpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE4121 ; SSE41-LABEL: trunc2x2i64:22 ; SSE41: # BB#0: # %entry23 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,0,2]24 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]25 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]26 ; SSE41-NEXT: retq83 ; SSE41-LABEL: trunc2x4i32:84 ; SSE41: # BB#0: # %entry85 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15][all …]
2 … < %s -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -mattr=sse4.1 | FileCheck %s -check-prefix=SSE4113 ; SSE41-LABEL: v16i8_icmp_uge:14 ; SSE41: pmaxub %xmm0, %xmm115 ; SSE41: pcmpeqb %xmm1, %xmm030 ; SSE41-LABEL: v16i8_icmp_ule:31 ; SSE41: pminub %xmm0, %xmm132 ; SSE41: pcmpeqb %xmm1, %xmm049 ; SSE41-LABEL: v8i16_icmp_uge:50 ; SSE41: pmaxuw %xmm0, %xmm151 ; SSE41: pcmpeqw %xmm1, %xmm0[all …]
4 …cpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE41263 ; SSE41-LABEL: shuffle_v4f32_0022:264 ; SSE41: # BB#0:265 ; SSE41-NEXT: movsldup {{.*#+}} xmm0 = xmm0[0,0,2,2]266 ; SSE41-NEXT: retq291 ; SSE41-LABEL: shuffle_v4f32_1133:292 ; SSE41: # BB#0:293 ; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]294 ; SSE41-NEXT: retq323 ; SSE41-LABEL: shuffle_v4i32_0124:[all …]
3 …-unknown-unknown -mcpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE4128 ; SSE41-LABEL: zext_8i16_to_8i32:29 ; SSE41: # BB#0: # %entry30 ; SSE41-NEXT: movdqa %xmm0, %xmm131 ; SSE41-NEXT: pmovzxwd {{.*#+}} xmm0 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero32 ; SSE41-NEXT: punpckhwd {{.*#+}} xmm1 = xmm1[4,4,5,5,6,6,7,7]33 ; SSE41-NEXT: pand .LCPI0_0(%rip), %xmm134 ; SSE41-NEXT: retq74 ; SSE41-LABEL: zext_4i32_to_4i64:75 ; SSE41: # BB#0: # %entry[all …]
2 …mtriple=x86_64-unknown-unknown -mattr=sse4.1 | FileCheck %s --check-prefix=ALL --check-prefix=SSE4116 ; SSE41-LABEL: a:17 ; SSE41: # BB#0: # %entry18 ; SSE41-NEXT: pmulld {{.*}}(%rip), %xmm019 ; SSE41-NEXT: retq57 ; SSE41-LABEL: c:58 ; SSE41: # BB#0: # %entry59 ; SSE41-NEXT: pmulld %xmm1, %xmm060 ; SSE41-NEXT: retq107 ; SSE41-LABEL: e:[all …]
2 …ple-macosx -mattr=+sse4.1 | FileCheck --check-prefix=CHECK --check-prefix=SSE41 --check-prefix=CST…56 ; SSE41: movdqa [[LOWCSTADDR]](%rip), [[LOWVEC:%xmm[0-9]+]]57 ; SSE41-NEXT: pblendw $85, %xmm0, [[LOWVEC]]58 ; SSE41-NEXT: psrld $16, %xmm059 ; SSE41-NEXT: pblendw $170, [[HIGHCSTADDR]](%rip), %xmm060 ; SSE41-NEXT: addps [[MAGICCSTADDR]](%rip), %xmm061 ; SSE41-NEXT: addps [[LOWVEC]], %xmm062 ; SSE41-NEXT: retq122 ; SSE41: movdqa {{.*#+}} [[LOWCST:xmm[0-9]+]] = [1258291200,1258291200,1258291200,1258291200]123 ; SSE41-NEXT: movdqa %xmm0, [[VECLOW:%xmm[0-9]+]][all …]
3 …cpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE4133 ; SSE41-LABEL: shuffle_v16i8_00_00_00_00_00_00_00_00_00_00_00_00_00_00_00_00:34 ; SSE41: # BB#0:35 ; SSE41-NEXT: pxor %xmm1, %xmm136 ; SSE41-NEXT: pshufb %xmm1, %xmm037 ; SSE41-NEXT: retq67 ; SSE41-LABEL: shuffle_v16i8_00_00_00_00_00_00_00_00_01_01_01_01_01_01_01_01:68 ; SSE41: # BB#0:69 ; SSE41-NEXT: pshufb {{.*#+}} xmm0 = xmm0[0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1]70 ; SSE41-NEXT: retq[all …]
1 …cpu=corei7 -mtriple=x86_64-unknown-linux-gnu | FileCheck %s -check-prefix=CHECK -check-prefix=SSE4113 ; SSE41: paddd26 ; SSE41: paddw38 ; SSE41: paddb51 ; SSE41: psubd64 ; SSE41: psubw77 ; SSE41: psubb90 ; SSE41: pmulld103 ; SSE41: pmullw129 ; SSE41: andps[all …]
3 …cpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE41292 ; SSE41-LABEL: combine_bitwise_ops_test1b:293 ; SSE41: # BB#0:294 ; SSE41-NEXT: pand %xmm1, %xmm0295 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]296 ; SSE41-NEXT: retq332 ; SSE41-LABEL: combine_bitwise_ops_test2b:333 ; SSE41: # BB#0:334 ; SSE41-NEXT: por %xmm1, %xmm0335 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7][all …]
2 ; RUN: llc < %s -march=x86 -mattr=-sse4.2,+sse4.1 | FileCheck %s -check-prefix=SSE419 ; SSE41-LABEL: test1:10 ; SSE41-NOT: pcmpgtq11 ; SSE41: ret25 ; SSE41-LABEL: test2:26 ; SSE41: pcmpeqq27 ; SSE41: ret
4 …cpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE41116 ; SSE41-LABEL: shuffle_v2f64_00:117 ; SSE41: # BB#0:118 ; SSE41-NEXT: movddup {{.*#+}} xmm0 = xmm0[0,0]119 ; SSE41-NEXT: retq171 ; SSE41-LABEL: shuffle_v2f64_22:172 ; SSE41: # BB#0:173 ; SSE41-NEXT: movddup {{.*#+}} xmm0 = xmm1[0,0]174 ; SSE41-NEXT: retq230 ; SSE41-LABEL: shuffle_v2f64_03:[all …]
1 …4-apple-darwin -mcpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE416 ; SSE41: pmovsxbw (%rdi), %xmm015 ; SSE41: pmovsxbd (%rdi), %xmm024 ; SSE41: pmovsxbq (%rdi), %xmm033 ; SSE41: pmovsxwd (%rdi), %xmm042 ; SSE41: pmovsxwq (%rdi), %xmm051 ; SSE41: pmovsxdq (%rdi), %xmm060 ; SSE41: pmovzxbw (%rdi), %xmm069 ; SSE41: pmovzxbd (%rdi), %xmm078 ; SSE41: pmovzxbq (%rdi), %xmm0[all …]
1 ; RUN: llc < %s -o - -mcpu=generic -march=x86-64 -mattr=+sse4.1 | FileCheck %s -check-prefix=SSE416 ; SSE41: pextrb8 ; SSE41-NOT: movb16 ; SSE41: pextrw18 ; SSE41-NOT: movw
1 ; RUN: llc < %s -march=x86-64 -mcpu=penryn | FileCheck -check-prefix=SSE41 %s15 ; SSE41-LABEL: test1:16 ; SSE41: pmovsxbq43 ; SSE41-LABEL: test3:44 ; SSE41: pmovsxbd71 ; SSE41-LABEL: test5:72 ; SSE41: pmovsxbw100 ; SSE41-LABEL: test7:101 ; SSE41: pmovsxwq128 ; SSE41-LABEL: test9:[all …]
3 …-unknown-unknown -mcpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE41
3 …-linux-gnu -mcpu=corei7 -cost-model -analyze | FileCheck %s -check-prefix=CHECK -check-prefix=SSE4121 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector32 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector43 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector54 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector68 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector79 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector91 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector103 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector116 ; SSE41: Cost Model: {{.*}} 1 for instruction: %1 = shufflevector[all …]
2 …-linux-gnu -mcpu=corei7 -cost-model -analyze | FileCheck %s -check-prefix=CHECK -check-prefix=SSE419 ; SSE41 added blend instructions with an immediate for <2 x double> and15 ; SSE41: Cost Model: {{.*}} 1 for instruction: %sel = select <2 x i1>25 ; SSE41: Cost Model: {{.*}} 1 for instruction: %sel = select <2 x i1>35 ; SSE41: Cost Model: {{.*}} 1 for instruction: %sel = select <4 x i1>45 ; SSE41: Cost Model: {{.*}} 1 for instruction: %sel = select <4 x i1>55 ; SSE41: Cost Model: {{.*}} 1 for instruction: %sel = select <16 x i1>67 ; SSE41: Cost Model: {{.*}} 2 for instruction: %sel = select <4 x i1>77 ; SSE41: Cost Model: {{.*}} 2 for instruction: %sel = select <4 x i1>87 ; SSE41: Cost Model: {{.*}} 2 for instruction: %sel = select <8 x i1>[all …]
2 …-linux-gnu -mcpu=corei7 -cost-model -analyze | FileCheck %s -check-prefix=CHECK -check-prefix=SSE4139 ; SSE41: Found an estimated cost of 1 for instruction: %shl50 ; SSE41: Found an estimated cost of 1 for instruction: %shl66 ; SSE41: Found an estimated cost of 20 for instruction: %shl90 ; SSE41: Found an estimated cost of 2 for instruction: %shl105 ; SSE41: Found an estimated cost of 2 for instruction: %shl121 ; SSE41: Found an estimated cost of 40 for instruction: %shl134 ; SSE41: Found an estimated cost of 4 for instruction: %shl147 ; SSE41: Found an estimated cost of 4 for instruction: %shl163 ; SSE41: Found an estimated cost of 80 for instruction: %shl
50 NoMMXSSE, MMX, SSE1, SSE2, SSE3, SSSE3, SSE41, SSE42, AVX, AVX2, AVX512F enumerator332 bool hasSSE41() const { return X86SSELevel >= SSE41; } in hasSSE41()