Home
last modified time | relevance | path

Searched refs:SSE41 (Results 1 – 25 of 237) sorted by relevance

12345678910

/external/llvm-project/llvm/test/CodeGen/X86/
Dfp-strict-scalar-round.ll2 …: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse4.1 -O3 | FileCheck %s --check-prefix=SSE41-X86
3 …llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 -O3 | FileCheck %s --check-prefix=SSE41-X64
25 ; SSE41-X86-LABEL: fceil32:
26 ; SSE41-X86: # %bb.0:
27 ; SSE41-X86-NEXT: pushl %eax
28 ; SSE41-X86-NEXT: .cfi_def_cfa_offset 8
29 ; SSE41-X86-NEXT: movss {{.*#+}} xmm0 = mem[0],zero,zero,zero
30 ; SSE41-X86-NEXT: roundss $10, %xmm0, %xmm0
31 ; SSE41-X86-NEXT: movss %xmm0, (%esp)
32 ; SSE41-X86-NEXT: flds (%esp)
[all …]
Dcombine-64bit-vec-binop.ll2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=sse4.1 | FileCheck %s --check-prefix=SSE41
5 ; SSE41-LABEL: test1_add:
6 ; SSE41: # %bb.0:
7 ; SSE41-NEXT: paddd %xmm1, %xmm0
8 ; SSE41-NEXT: retq
17 ; SSE41-LABEL: test2_add:
18 ; SSE41: # %bb.0:
19 ; SSE41-NEXT: paddw %xmm1, %xmm0
20 ; SSE41-NEXT: retq
29 ; SSE41-LABEL: test3_add:
[all …]
Dvec_floor.ll2 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE41
8 ; SSE41-LABEL: floor_v2f64:
9 ; SSE41: ## %bb.0:
10 ; SSE41-NEXT: roundpd $9, %xmm0, %xmm0
11 ; SSE41-NEXT: retq
28 ; SSE41-LABEL: floor_v4f32:
29 ; SSE41: ## %bb.0:
30 ; SSE41-NEXT: roundps $9, %xmm0, %xmm0
31 ; SSE41-NEXT: retq
48 ; SSE41-LABEL: floor_v4f64:
[all …]
Dvec_setcc-2.ll3 …c < %s -o - -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefixes=CHECK,SSE41
29 ; SSE41-LABEL: loop_no_const_reload:
30 ; SSE41: ## %bb.0: ## %entry
31 ; SSE41-NEXT: testl %edx, %edx
32 ; SSE41-NEXT: je LBB0_3
33 ; SSE41-NEXT: ## %bb.1: ## %for.body.preheader
34 ; SSE41-NEXT: xorl %eax, %eax
35 ; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [25,25,25,25,25,25,25,25]
36 ; SSE41-NEXT: .p2align 4, 0x90
37 ; SSE41-NEXT: LBB0_2: ## %for.body
[all …]
Dvec-strict-inttofp-128.ll4 … < %s -mtriple=i686-unknown-unknown -mattr=+sse2 -O3 | FileCheck %s --check-prefixes=SSE41,SSE41-32
5 … %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 -O3 | FileCheck %s --check-prefixes=SSE41,SSE41-64
47 ; SSE41-LABEL: sitofp_v2i32_v2f32:
48 ; SSE41: # %bb.0:
49 ; SSE41-NEXT: movq {{.*#+}} xmm0 = xmm0[0],zero
50 ; SSE41-NEXT: cvtdq2ps %xmm0, %xmm0
51 ; SSE41-NEXT: ret{{[l|q]}}
75 ; SSE41-LABEL: uitofp_v2i32_v2f32:
76 ; SSE41: # %bb.0:
77 ; SSE41-NEXT: xorpd %xmm1, %xmm1
[all …]
Dvector-idiv-sdiv-128.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE41
35 ; SSE41-LABEL: test_div7_2i64:
36 ; SSE41: # %bb.0:
37 ; SSE41-NEXT: pextrq $1, %xmm0, %rax
38 ; SSE41-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
39 ; SSE41-NEXT: imulq %rcx
40 ; SSE41-NEXT: movq %rdx, %rax
41 ; SSE41-NEXT: shrq $63, %rax
42 ; SSE41-NEXT: sarq %rdx
43 ; SSE41-NEXT: addq %rax, %rdx
[all …]
Dwiden_arith-4.ll3 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE41
42 ; SSE41-LABEL: update:
43 ; SSE41: # %bb.0: # %entry
44 ; SSE41-NEXT: movq %rdi, -{{[0-9]+}}(%rsp)
45 ; SSE41-NEXT: movq %rsi, -{{[0-9]+}}(%rsp)
46 ; SSE41-NEXT: movl %edx, -{{[0-9]+}}(%rsp)
47 ; SSE41-NEXT: movabsq $4295032833, %rax # imm = 0x100010001
48 ; SSE41-NEXT: movq %rax, -{{[0-9]+}}(%rsp)
49 ; SSE41-NEXT: movw $0, -{{[0-9]+}}(%rsp)
50 ; SSE41-NEXT: movl $0, -{{[0-9]+}}(%rsp)
[all …]
Dsse41-pmovxrm.ll2 …s -disable-peephole -mtriple=x86_64-apple-darwin -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE41
7 ; SSE41-LABEL: test_llvm_x86_sse41_pmovsxbw:
8 ; SSE41: ## %bb.0:
9 ; SSE41-NEXT: pmovsxbw (%rdi), %xmm0
10 ; SSE41-NEXT: retq
23 ; SSE41-LABEL: test_llvm_x86_sse41_pmovsxbd:
24 ; SSE41: ## %bb.0:
25 ; SSE41-NEXT: pmovsxbd (%rdi), %xmm0
26 ; SSE41-NEXT: retq
39 ; SSE41-LABEL: test_llvm_x86_sse41_pmovsxbq:
[all …]
Dptest.ll3 …N: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1,-avx | FileCheck %s --check-prefix=SSE41
22 ; SSE41-LABEL: veccond128:
23 ; SSE41: # %bb.0: # %entry
24 ; SSE41-NEXT: ptest %xmm0, %xmm0
25 ; SSE41-NEXT: je .LBB0_2
26 ; SSE41-NEXT: # %bb.1: # %if-true-block
27 ; SSE41-NEXT: xorl %eax, %eax
28 ; SSE41-NEXT: retq
29 ; SSE41-NEXT: .LBB0_2: # %endif-block
30 ; SSE41-NEXT: movl $1, %eax
[all …]
Dvec-strict-round-128.ll2 …UN: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse4.1 -O3 | FileCheck %s --check-prefixes=SSE41
3 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 -O3 | FileCheck %s --check-prefixes=SSE41
21 ; SSE41-LABEL: fceilv4f32:
22 ; SSE41: # %bb.0:
23 ; SSE41-NEXT: roundps $10, %xmm0, %xmm0
24 ; SSE41-NEXT: ret{{[l|q]}}
36 ; SSE41-LABEL: fceilv2f64:
37 ; SSE41: # %bb.0:
38 ; SSE41-NEXT: roundpd $10, %xmm0, %xmm0
39 ; SSE41-NEXT: ret{{[l|q]}}
[all …]
Dpmovsx-inreg.ll2 ; RUN: llc < %s -mtriple=x86_64-unknwon -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE41
11 ; SSE41-LABEL: test1:
12 ; SSE41: # %bb.0:
13 ; SSE41-NEXT: pmovsxbq (%rdi), %xmm0
14 ; SSE41-NEXT: xorps %xmm1, %xmm1
15 ; SSE41-NEXT: movups %xmm1, (%rax)
16 ; SSE41-NEXT: movdqu %xmm0, (%rsi)
17 ; SSE41-NEXT: retq
44 ; SSE41-LABEL: test2:
45 ; SSE41: # %bb.0:
[all …]
Dvector-reduce-fmax.ll3 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefixes=SSE,SSE41
36 ; SSE41-LABEL: test_v2f32:
37 ; SSE41: # %bb.0:
38 ; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
39 ; SSE41-NEXT: movaps %xmm0, %xmm1
40 ; SSE41-NEXT: cmpunordss %xmm0, %xmm1
41 ; SSE41-NEXT: movaps %xmm1, %xmm3
42 ; SSE41-NEXT: andps %xmm2, %xmm3
43 ; SSE41-NEXT: maxss %xmm0, %xmm2
44 ; SSE41-NEXT: andnps %xmm2, %xmm1
[all …]
Dvector-reduce-fmin.ll3 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefixes=SSE,SSE41
28 ; SSE41-LABEL: test_v2f32:
29 ; SSE41: # %bb.0:
30 ; SSE41-NEXT: movshdup {{.*#+}} xmm2 = xmm0[1,1,3,3]
31 ; SSE41-NEXT: movaps %xmm0, %xmm1
32 ; SSE41-NEXT: cmpunordss %xmm0, %xmm1
33 ; SSE41-NEXT: movaps %xmm1, %xmm3
34 ; SSE41-NEXT: andps %xmm2, %xmm3
35 ; SSE41-NEXT: minss %xmm0, %xmm2
36 ; SSE41-NEXT: andnps %xmm2, %xmm1
[all …]
Dvector-sext.ll4 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefixes=SSE,SSE41
12 …< %s -mtriple=i686-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefixes=X86-SSE,X86-SSE41
27 ; SSE41-LABEL: sext_16i8_to_8i16:
28 ; SSE41: # %bb.0: # %entry
29 ; SSE41-NEXT: pmovsxbw %xmm0, %xmm0
30 ; SSE41-NEXT: retq
43 ; X86-SSE41-LABEL: sext_16i8_to_8i16:
44 ; X86-SSE41: # %bb.0: # %entry
45 ; X86-SSE41-NEXT: pmovsxbw %xmm0, %xmm0
46 ; X86-SSE41-NEXT: retl
[all …]
Dvector-reduce-or-cmp.ll3 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefixes=SSE,SSE41
23 ; SSE41-LABEL: test_v2i64:
24 ; SSE41: # %bb.0:
25 ; SSE41-NEXT: ptest %xmm0, %xmm0
26 ; SSE41-NEXT: sete %al
27 ; SSE41-NEXT: retq
50 ; SSE41-LABEL: test_v4i64:
51 ; SSE41: # %bb.0:
52 ; SSE41-NEXT: por %xmm1, %xmm0
53 ; SSE41-NEXT: ptest %xmm0, %xmm0
[all …]
Dvector-trunc-packus.ll4 …triple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE41
81 ; SSE41-LABEL: trunc_packus_v2i64_v2i32:
82 ; SSE41: # %bb.0:
83 ; SSE41-NEXT: movdqa %xmm0, %xmm1
84 ; SSE41-NEXT: movapd {{.*#+}} xmm2 = [4294967295,4294967295]
85 ; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648]
86 ; SSE41-NEXT: pxor %xmm3, %xmm0
87 ; SSE41-NEXT: movdqa {{.*#+}} xmm4 = [2147483647,2147483647]
88 ; SSE41-NEXT: movdqa %xmm4, %xmm5
89 ; SSE41-NEXT: pcmpeqd %xmm0, %xmm5
[all …]
/external/llvm/test/CodeGen/X86/
Dvec_floor.ll2 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE41
6 ; SSE41-LABEL: floor_v2f64:
7 ; SSE41: ## BB#0:
8 ; SSE41-NEXT: roundpd $9, %xmm0, %xmm0
9 ; SSE41-NEXT: retq
21 ; SSE41-LABEL: floor_v4f32:
22 ; SSE41: ## BB#0:
23 ; SSE41-NEXT: roundps $9, %xmm0, %xmm0
24 ; SSE41-NEXT: retq
36 ; SSE41-LABEL: floor_v4f64:
[all …]
Dpr12312.ll1 …N: llc -mtriple=x86_64-unknown-unknown -mattr=+sse4.1,-avx < %s | FileCheck %s --check-prefix SSE41
14 ; SSE41: veccond128
15 ; SSE41: ptest
16 ; SSE41: ret
32 ; SSE41: veccond256
33 ; SSE41: por
34 ; SSE41: ptest
35 ; SSE41: ret
51 ; SSE41: veccond512
52 ; SSE41: por
[all …]
Dsse41-intrinsics-x86.ll2 … -mtriple=i386-apple-darwin -mattr=+sse4.1 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE41
6 ; SSE41-LABEL: test_x86_sse41_blendvpd:
7 ; SSE41: ## BB#0:
8 ; SSE41-NEXT: movapd %xmm0, %xmm3
9 ; SSE41-NEXT: movaps %xmm2, %xmm0
10 ; SSE41-NEXT: blendvpd %xmm1, %xmm3
11 ; SSE41-NEXT: movapd %xmm3, %xmm0
12 ; SSE41-NEXT: retl
25 ; SSE41-LABEL: test_x86_sse41_blendvps:
26 ; SSE41: ## BB#0:
[all …]
Dvector-sext.ll4 …triple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE41
10 ; RUN: llc < %s -mtriple=i686-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=X32-SSE41
25 ; SSE41-LABEL: sext_16i8_to_8i16:
26 ; SSE41: # BB#0: # %entry
27 ; SSE41-NEXT: pmovsxbw %xmm0, %xmm0
28 ; SSE41-NEXT: retq
35 ; X32-SSE41-LABEL: sext_16i8_to_8i16:
36 ; X32-SSE41: # BB#0: # %entry
37 ; X32-SSE41-NEXT: pmovsxbw %xmm0, %xmm0
38 ; X32-SSE41-NEXT: retl
[all …]
Dsse41-pmovxrm.ll2 …mtriple=x86_64-apple-darwin -mattr=+sse4.1 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE41
6 ; SSE41-LABEL: test_llvm_x86_sse41_pmovsxbw:
7 ; SSE41: ## BB#0:
8 ; SSE41-NEXT: pmovsxbw (%rdi), %xmm0
9 ; SSE41-NEXT: retq
22 ; SSE41-LABEL: test_llvm_x86_sse41_pmovsxbd:
23 ; SSE41: ## BB#0:
24 ; SSE41-NEXT: pmovsxbd (%rdi), %xmm0
25 ; SSE41-NEXT: retq
38 ; SSE41-LABEL: test_llvm_x86_sse41_pmovsxbq:
[all …]
Dvector-idiv-sdiv-128.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE41
34 ; SSE41-LABEL: test_div7_2i64:
35 ; SSE41: # BB#0:
36 ; SSE41-NEXT: pextrq $1, %xmm0, %rax
37 ; SSE41-NEXT: movabsq $5270498306774157605, %rcx # imm = 0x4924924924924925
38 ; SSE41-NEXT: imulq %rcx
39 ; SSE41-NEXT: movq %rdx, %rax
40 ; SSE41-NEXT: shrq $63, %rax
41 ; SSE41-NEXT: sarq %rdx
42 ; SSE41-NEXT: addq %rax, %rdx
[all …]
Dvector-idiv-udiv-128.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE41
36 ; SSE41-LABEL: test_div7_2i64:
37 ; SSE41: # BB#0:
38 ; SSE41-NEXT: pextrq $1, %xmm0, %rcx
39 ; SSE41-NEXT: movabsq $2635249153387078803, %rsi # imm = 0x2492492492492493
40 ; SSE41-NEXT: movq %rcx, %rax
41 ; SSE41-NEXT: mulq %rsi
42 ; SSE41-NEXT: subq %rdx, %rcx
43 ; SSE41-NEXT: shrq %rcx
44 ; SSE41-NEXT: addq %rdx, %rcx
[all …]
Dpmul.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.1 | FileCheck %s --check-prefix=SSE --check-prefix=SSE41
26 ; SSE41-LABEL: mul_v16i8c:
27 ; SSE41: # BB#0: # %entry
28 ; SSE41-NEXT: pmovsxbw %xmm0, %xmm1
29 ; SSE41-NEXT: pmovsxbw {{.*}}(%rip), %xmm2
30 ; SSE41-NEXT: pmullw %xmm2, %xmm1
31 ; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [255,255,255,255,255,255,255,255]
32 ; SSE41-NEXT: pand %xmm3, %xmm1
33 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[2,3,0,1]
34 ; SSE41-NEXT: pmovsxbw %xmm0, %xmm0
[all …]
/external/llvm/test/Analysis/CostModel/X86/
Dsse-itoi.ll2 …le=x86_64-apple-darwin -mattr=+sse4.1 -cost-model -analyze < %s | FileCheck --check-prefix=SSE41 %s
8 ; SSE41: zext_v4i8_to_v4i64
9 ; SSE41: cost of 2 {{.*}} zext
21 ; SSE41: sext_v4i8_to_v4i64
22 ; SSE41: cost of 2 {{.*}} sext
34 ; SSE41: zext_v4i16_to_v4i64
35 ; SSE41: cost of 2 {{.*}} zext
47 ; SSE41: sext_v4i16_to_v4i64
48 ; SSE41: cost of 2 {{.*}} sext
61 ; SSE41: zext_v4i32_to_v4i64
[all …]

12345678910