Home
last modified time | relevance | path

Searched refs:SSE42 (Results 1 – 25 of 107) sorted by relevance

12345

/external/swiftshader/third_party/llvm-7.0/llvm/test/CodeGen/X86/
Dvector-compare-results.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
60 ; SSE42-LABEL: test_cmp_v2i64:
61 ; SSE42: # %bb.0:
62 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
63 ; SSE42-NEXT: retq
218 ; SSE42-LABEL: test_cmp_v4i64:
219 ; SSE42: # %bb.0:
220 ; SSE42-NEXT: pcmpgtq %xmm3, %xmm1
221 ; SSE42-NEXT: pcmpgtq %xmm2, %xmm0
222 ; SSE42-NEXT: packssdw %xmm1, %xmm0
[all …]
Dwiden_conv-4.ll3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42
5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42
28 ; X86-SSE42-LABEL: convert_v7i16_v7f32:
29 ; X86-SSE42: # %bb.0: # %entry
30 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
31 ; X86-SSE42-NEXT: pxor %xmm1, %xmm1
32 ; X86-SSE42-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
33 ; X86-SSE42-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0…
34 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
35 ; X86-SSE42-NEXT: cvtdq2ps %xmm2, %xmm1
[all …]
Dwiden_conv-3.ll3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42
5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42
22 ; X86-SSE42-LABEL: convert_v2i16_to_v2f32:
23 ; X86-SSE42: # %bb.0: # %entry
24 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
25 ; X86-SSE42-NEXT: psllq $48, %xmm0
26 ; X86-SSE42-NEXT: psrad $16, %xmm0
27 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
28 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
29 ; X86-SSE42-NEXT: extractps $1, %xmm0, 4(%eax)
[all …]
Doddshuffles.ll3 …< %s -mtriple=x86_64-pc-linux -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
18 ; SSE42-LABEL: v3i64:
19 ; SSE42: # %bb.0:
20 ; SSE42-NEXT: pextrq $1, %xmm0, 16(%rdi)
21 ; SSE42-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
22 ; SSE42-NEXT: movdqa %xmm0, (%rdi)
23 ; SSE42-NEXT: retq
77 ; SSE42-LABEL: v3i32:
78 ; SSE42: # %bb.0:
79 ; SSE42-NEXT: extractps $2, %xmm0, 8(%rdi)
[all …]
Dhorizontal-reduce-umax.ll3 … -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE --check-prefix=X86-SSE42
7 …in -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
44 ; X86-SSE42-NEXT: movdqa {{.*#+}} xmm3 = [0,2147483648,0,2147483648]
45 ; X86-SSE42-NEXT: pxor %xmm3, %xmm0
46 ; X86-SSE42-NEXT: pxor %xmm2, %xmm3
47 ; X86-SSE42-NEXT: pcmpgtq %xmm3, %xmm0
[all …]
Dhorizontal-reduce-umin.ll3 … -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE --check-prefix=X86-SSE42
7 …in -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
44 ; X86-SSE42-NEXT: movdqa {{.*#+}} xmm0 = [0,2147483648,0,2147483648]
45 ; X86-SSE42-NEXT: movdqa %xmm1, %xmm3
46 ; X86-SSE42-NEXT: pxor %xmm0, %xmm3
47 ; X86-SSE42-NEXT: pxor %xmm2, %xmm0
[all …]
Dvselect-packss.ll3 …ple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
26 ; SSE42-LABEL: vselect_packss_v16i16:
27 ; SSE42: # %bb.0:
28 ; SSE42-NEXT: pcmpeqw %xmm3, %xmm1
29 ; SSE42-NEXT: pcmpeqw %xmm2, %xmm0
30 ; SSE42-NEXT: packsswb %xmm1, %xmm0
31 ; SSE42-NEXT: pblendvb %xmm0, %xmm4, %xmm5
32 ; SSE42-NEXT: movdqa %xmm5, %xmm0
33 ; SSE42-NEXT: retq
104 ; SSE42-LABEL: vselect_packss_v16i32:
[all …]
Dhorizontal-reduce-smin.ll3 … -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE --check-prefix=X86-SSE42
7 …in -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
44 ; X86-SSE42-NEXT: movdqa %xmm2, %xmm0
45 ; X86-SSE42-NEXT: pcmpgtq %xmm1, %xmm0
46 ; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
47 ; X86-SSE42-NEXT: movd %xmm2, %eax
[all …]
Dhorizontal-reduce-smax.ll3 … -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE --check-prefix=X86-SSE42
7 …in -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,0,1]
44 ; X86-SSE42-NEXT: pcmpgtq %xmm2, %xmm0
45 ; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
46 ; X86-SSE42-NEXT: movd %xmm2, %eax
47 ; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx
[all …]
Dvec_minmax_uint.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
53 ; SSE42-LABEL: max_gt_v2i64:
54 ; SSE42: # %bb.0:
55 ; SSE42-NEXT: movdqa %xmm0, %xmm2
56 ; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
57 ; SSE42-NEXT: movdqa %xmm1, %xmm3
58 ; SSE42-NEXT: pxor %xmm0, %xmm3
59 ; SSE42-NEXT: pxor %xmm2, %xmm0
60 ; SSE42-NEXT: pcmpgtq %xmm3, %xmm0
61 ; SSE42-NEXT: blendvpd %xmm0, %xmm2, %xmm1
[all …]
Dclear_upper_vector_element_bits.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
17 ; SSE42-LABEL: _clearupper2xi64a:
18 ; SSE42: # %bb.0:
19 ; SSE42-NEXT: xorps %xmm1, %xmm1
20 ; SSE42-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
21 ; SSE42-NEXT: retq
47 ; SSE42-LABEL: _clearupper4xi64a:
48 ; SSE42: # %bb.0:
49 ; SSE42-NEXT: xorps %xmm2, %xmm2
50 ; SSE42-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]
[all …]
Dmulvi32.ll3 … < %s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
48 ; SSE42-LABEL: _mul2xi32b:
49 ; SSE42: # %bb.0:
50 ; SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,2,2,3]
51 ; SSE42-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
52 ; SSE42-NEXT: pmuludq %xmm0, %xmm1
53 ; SSE42-NEXT: pmovzxdq {{.*#+}} xmm0 = xmm1[0],zero,xmm1[1],zero
54 ; SSE42-NEXT: retq
83 ; SSE42-LABEL: _mul4xi32a:
84 ; SSE42: # %bb.0:
[all …]
Dvec_cmp_uint-128.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
29 ; SSE42-LABEL: eq_v2i64:
30 ; SSE42: # %bb.0:
31 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
32 ; SSE42-NEXT: retq
129 ; SSE42-LABEL: ne_v2i64:
130 ; SSE42: # %bb.0:
131 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
132 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm1
133 ; SSE42-NEXT: pxor %xmm1, %xmm0
[all …]
Dvec_minmax_sint.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
53 ; SSE42-LABEL: max_gt_v2i64:
54 ; SSE42: # %bb.0:
55 ; SSE42-NEXT: movdqa %xmm0, %xmm2
56 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
57 ; SSE42-NEXT: blendvpd %xmm0, %xmm2, %xmm1
58 ; SSE42-NEXT: movapd %xmm1, %xmm0
59 ; SSE42-NEXT: retq
154 ; SSE42-LABEL: max_gt_v4i64:
155 ; SSE42: # %bb.0:
[all …]
Dshuffle-strided-with-offset-128.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
33 ; SSE42-LABEL: shuffle_v16i8_to_v8i8_1:
34 ; SSE42: # %bb.0:
35 ; SSE42-NEXT: movdqa (%rdi), %xmm0
36 ; SSE42-NEXT: pshufb {{.*#+}} xmm0 = xmm0[1,3,5,7,9,11,13,15,u,u,u,u,u,u,u,u]
37 ; SSE42-NEXT: movq %xmm0, (%rsi)
38 ; SSE42-NEXT: retq
89 ; SSE42-LABEL: shuffle_v8i16_to_v4i16_1:
90 ; SSE42: # %bb.0:
91 ; SSE42-NEXT: movdqa (%rdi), %xmm0
[all …]
Dvec_compare-sse4.ll4 ; RUN: llc < %s -mtriple=i686-apple-darwin9 -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE42
37 ; SSE42-LABEL: test1:
38 ; SSE42: ## %bb.0:
39 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
40 ; SSE42-NEXT: retl
59 ; SSE42-LABEL: test2:
60 ; SSE42: ## %bb.0:
61 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
62 ; SSE42-NEXT: retl
/external/llvm/test/CodeGen/X86/
Dvector-compare-results.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
58 ; SSE42-LABEL: test_cmp_v2i64:
59 ; SSE42: # BB#0:
60 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
61 ; SSE42-NEXT: retq
127 ; SSE42-LABEL: test_cmp_v4f64:
128 ; SSE42: # BB#0:
129 ; SSE42-NEXT: cmpltpd %xmm1, %xmm3
130 ; SSE42-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,1,0,2]
131 ; SSE42-NEXT: cmpltpd %xmm0, %xmm2
[all …]
Dwiden_conv-4.ll3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42
5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42
28 ; X86-SSE42-LABEL: convert_v7i16_v7f32:
29 ; X86-SSE42: # BB#0: # %entry
30 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
31 ; X86-SSE42-NEXT: pxor %xmm1, %xmm1
32 ; X86-SSE42-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
33 ; X86-SSE42-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0…
34 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
35 ; X86-SSE42-NEXT: cvtdq2ps %xmm2, %xmm1
[all …]
Dwiden_conv-3.ll3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42
5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42
22 ; X86-SSE42-LABEL: convert_v2i16_to_v2f32:
23 ; X86-SSE42: # BB#0: # %entry
24 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
25 ; X86-SSE42-NEXT: psllq $48, %xmm0
26 ; X86-SSE42-NEXT: psrad $16, %xmm0
27 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
28 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
29 ; X86-SSE42-NEXT: extractps $1, %xmm0, 4(%eax)
[all …]
Dvec_minmax_uint.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
53 ; SSE42-LABEL: max_gt_v2i64:
54 ; SSE42: # BB#0:
55 ; SSE42-NEXT: movdqa %xmm0, %xmm2
56 ; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
57 ; SSE42-NEXT: movdqa %xmm1, %xmm3
58 ; SSE42-NEXT: pxor %xmm0, %xmm3
59 ; SSE42-NEXT: pxor %xmm2, %xmm0
60 ; SSE42-NEXT: pcmpgtq %xmm3, %xmm0
61 ; SSE42-NEXT: blendvpd %xmm2, %xmm1
[all …]
Dvec_minmax_sint.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
53 ; SSE42-LABEL: max_gt_v2i64:
54 ; SSE42: # BB#0:
55 ; SSE42-NEXT: movdqa %xmm0, %xmm2
56 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
57 ; SSE42-NEXT: blendvpd %xmm2, %xmm1
58 ; SSE42-NEXT: movapd %xmm1, %xmm0
59 ; SSE42-NEXT: retq
140 ; SSE42-LABEL: max_gt_v4i64:
141 ; SSE42: # BB#0:
[all …]
Dvec_cmp_uint-128.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
29 ; SSE42-LABEL: eq_v2i64:
30 ; SSE42: # BB#0:
31 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
32 ; SSE42-NEXT: retq
129 ; SSE42-LABEL: ne_v2i64:
130 ; SSE42: # BB#0:
131 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
132 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm1
133 ; SSE42-NEXT: pxor %xmm1, %xmm0
[all …]
Dvec_compare-sse4.ll4 ; RUN: llc < %s -mtriple=i686-apple-darwin9 -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE42
37 ; SSE42-LABEL: test1:
38 ; SSE42: ## BB#0:
39 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
40 ; SSE42-NEXT: retl
59 ; SSE42-LABEL: test2:
60 ; SSE42: ## BB#0:
61 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
62 ; SSE42-NEXT: retl
/external/llvm/test/Analysis/CostModel/X86/
Darith.ll2 …e=x86_64-apple-macosx10.8.0 -mattr=+sse4.2 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE42
12 ; SSE42: cost of 1 {{.*}} %A = add
17 ; SSE42: cost of 2 {{.*}} %B = add
22 ; SSE42: cost of 1 {{.*}} %C = add
27 ; SSE42: cost of 2 {{.*}} %D = add
32 ; SSE42: cost of 4 {{.*}} %E = add
42 ; SSE42: cost of 1 {{.*}} %A = xor
47 ; SSE42: cost of 2 {{.*}} %B = xor
52 ; SSE42: cost of 1 {{.*}} %C = xor
57 ; SSE42: cost of 2 {{.*}} %D = xor
[all …]
/external/swiftshader/third_party/LLVM/test/CodeGen/X86/
Dvec_compare-sse4.ll3 ; RUN: llc < %s -march=x86 -mattr=+sse42 | FileCheck %s -check-prefix=SSE42
6 ; SSE42: test1:
7 ; SSE42: pcmpgtq
8 ; SSE42: ret
22 ; SSE42: test2:
23 ; SSE42: pcmpeqq
24 ; SSE42: ret

12345