1 // RUN: %clang_cc1 %s -triple=x86_64-apple-darwin -target-feature +avx -emit-llvm -o - | FileCheck %s
2
3 // Don't include mm_malloc.h, it's system specific.
4 #define __MM_MALLOC_H
5
6 #include <immintrin.h>
7
8 //
9 // Test LLVM IR codegen of shuffle instructions
10 //
11
test__mm256_loadu_ps(void * p)12 __m256 test__mm256_loadu_ps(void* p) {
13 // CHECK: load <8 x float>, <8 x float>* %{{.*}}, align 1
14 return _mm256_loadu_ps(p);
15 }
16
test__mm256_loadu_pd(void * p)17 __m256d test__mm256_loadu_pd(void* p) {
18 // CHECK: load <4 x double>, <4 x double>* %{{.*}}, align 1
19 return _mm256_loadu_pd(p);
20 }
21
test__mm256_loadu_si256(void * p)22 __m256i test__mm256_loadu_si256(void* p) {
23 // CHECK: load <4 x i64>, <4 x i64>* %{{.+}}, align 1
24 return _mm256_loadu_si256(p);
25 }
26
test_mm_cmpestrm(__m128i A,int LA,__m128i B,int LB)27 __m128i test_mm_cmpestrm(__m128i A, int LA, __m128i B, int LB) {
28 // CHECK: @llvm.x86.sse42.pcmpestrm128
29 return _mm_cmpestrm(A, LA, B, LB, 7);
30 }
31
test_mm_cmpestri(__m128i A,int LA,__m128i B,int LB)32 int test_mm_cmpestri(__m128i A, int LA, __m128i B, int LB) {
33 // CHECK: @llvm.x86.sse42.pcmpestri128
34 return _mm_cmpestri(A, LA, B, LB, 7);
35 }
36
test_mm_cmpestra(__m128i A,int LA,__m128i B,int LB)37 int test_mm_cmpestra(__m128i A, int LA, __m128i B, int LB) {
38 // CHECK: @llvm.x86.sse42.pcmpestria128
39 return _mm_cmpestra(A, LA, B, LB, 7);
40 }
41
test_mm_cmpestrc(__m128i A,int LA,__m128i B,int LB)42 int test_mm_cmpestrc(__m128i A, int LA, __m128i B, int LB) {
43 // CHECK: @llvm.x86.sse42.pcmpestric128
44 return _mm_cmpestrc(A, LA, B, LB, 7);
45 }
46
test_mm_cmpestro(__m128i A,int LA,__m128i B,int LB)47 int test_mm_cmpestro(__m128i A, int LA, __m128i B, int LB) {
48 // CHECK: @llvm.x86.sse42.pcmpestrio128
49 return _mm_cmpestro(A, LA, B, LB, 7);
50 }
51
test_mm_cmpestrs(__m128i A,int LA,__m128i B,int LB)52 int test_mm_cmpestrs(__m128i A, int LA, __m128i B, int LB) {
53 // CHECK: @llvm.x86.sse42.pcmpestris128
54 return _mm_cmpestrs(A, LA, B, LB, 7);
55 }
56
test_mm_cmpestrz(__m128i A,int LA,__m128i B,int LB)57 int test_mm_cmpestrz(__m128i A, int LA, __m128i B, int LB) {
58 // CHECK: @llvm.x86.sse42.pcmpestriz128
59 return _mm_cmpestrz(A, LA, B, LB, 7);
60 }
61
test_mm_cmpistrm(__m128i A,__m128i B)62 __m128i test_mm_cmpistrm(__m128i A, __m128i B) {
63 // CHECK: @llvm.x86.sse42.pcmpistrm128
64 return _mm_cmpistrm(A, B, 7);
65 }
66
test_mm_cmpistri(__m128i A,__m128i B)67 int test_mm_cmpistri(__m128i A, __m128i B) {
68 // CHECK: @llvm.x86.sse42.pcmpistri128
69 return _mm_cmpistri(A, B, 7);
70 }
71
test_mm_cmpistra(__m128i A,__m128i B)72 int test_mm_cmpistra(__m128i A, __m128i B) {
73 // CHECK: @llvm.x86.sse42.pcmpistria128
74 return _mm_cmpistra(A, B, 7);
75 }
76
test_mm_cmpistrc(__m128i A,__m128i B)77 int test_mm_cmpistrc(__m128i A, __m128i B) {
78 // CHECK: @llvm.x86.sse42.pcmpistric128
79 return _mm_cmpistrc(A, B, 7);
80 }
81
test_mm_cmpistro(__m128i A,__m128i B)82 int test_mm_cmpistro(__m128i A, __m128i B) {
83 // CHECK: @llvm.x86.sse42.pcmpistrio128
84 return _mm_cmpistro(A, B, 7);
85 }
86
test_mm_cmpistrs(__m128i A,__m128i B)87 int test_mm_cmpistrs(__m128i A, __m128i B) {
88 // CHECK: @llvm.x86.sse42.pcmpistris128
89 return _mm_cmpistrs(A, B, 7);
90 }
91
test_mm_cmpistrz(__m128i A,__m128i B)92 int test_mm_cmpistrz(__m128i A, __m128i B) {
93 // CHECK: @llvm.x86.sse42.pcmpistriz128
94 return _mm_cmpistrz(A, B, 7);
95 }
96
test_extract_epi32(__m256i __a)97 int test_extract_epi32(__m256i __a) {
98 // CHECK-LABEL: @test_extract_epi32
99 // CHECK: [[SHIFT1:%[^ ]+]] = and i32 %{{.*}}, 7
100 // CHECK: extractelement <8 x i32> %{{.*}}, i32 [[SHIFT1]]
101 return _mm256_extract_epi32(__a, 8);
102 }
103
test_extract_epi16(__m256i __a)104 int test_extract_epi16(__m256i __a) {
105 // CHECK-LABEL: @test_extract_epi16
106 // CHECK: [[SHIFT2:%[^ ]+]] = and i32 %{{.*}}, 15
107 // CHECK: extractelement <16 x i16> %{{.*}}, i32 [[SHIFT2]]
108 return _mm256_extract_epi16(__a, 16);
109 }
110
test_extract_epi8(__m256i __a)111 int test_extract_epi8(__m256i __a) {
112 // CHECK-LABEL: @test_extract_epi8
113 // CHECK: [[SHIFT3:%[^ ]+]] = and i32 %{{.*}}, 31
114 // CHECK: extractelement <32 x i8> %{{.*}}, i32 [[SHIFT3]]
115 return _mm256_extract_epi8(__a, 32);
116 }
117
test_256_blend_pd(__m256d __a,__m256d __b)118 __m256d test_256_blend_pd(__m256d __a, __m256d __b) {
119 // CHECK-LABEL: @test_256_blend_pd
120 // CHECK: shufflevector <4 x double> %{{.*}}, <4 x double> %{{.*}}, <4 x i32> <i32 4, i32 1, i32 6, i32 3>
121 return _mm256_blend_pd(__a, __b, 0x35);
122 }
123
test_256_blend_ps(__m256 __a,__m256 __b)124 __m256 test_256_blend_ps(__m256 __a, __m256 __b) {
125 // CHECK-LABEL: @test_256_blend_ps
126 // CHECK: shufflevector <8 x float> %{{.*}}, <8 x float> %{{.*}}, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 13, i32 6, i32 7>
127 return _mm256_blend_ps(__a, __b, 0x35);
128 }
129
test_256_insert_epi8(__m256i __a)130 __m256i test_256_insert_epi8(__m256i __a) {
131 // CHECK-LABEL: @test_256_insert_epi8
132 // CHECK: insertelement <32 x i8> {{.*}}, i8 {{.*}}, i32 {{.*}}
133 return _mm256_insert_epi8(__a, 42, 3);
134 }
135
test_256_insert_epi16(__m256i __a)136 __m256i test_256_insert_epi16(__m256i __a) {
137 // CHECK-LABEL: @test_256_insert_epi16
138 // CHECK: insertelement <16 x i16> {{.*}}, i16 {{.*}}, i32 {{.*}}
139 return _mm256_insert_epi16(__a, 42, 3);
140 }
141
test_256_insert_epi32(__m256i __a)142 __m256i test_256_insert_epi32(__m256i __a) {
143 // CHECK-LABEL: @test_256_insert_epi32
144 // CHECK: insertelement <8 x i32> {{.*}}, i32 {{.*}}, i32 {{.*}}
145 return _mm256_insert_epi32(__a, 42, 3);
146 }
147
test_256_insert_epi64(__m256i __a)148 __m256i test_256_insert_epi64(__m256i __a) {
149 // CHECK-LABEL: @test_256_insert_epi64
150 // CHECK: insertelement <4 x i64> {{.*}}, i64 {{.*}}, i32 {{.*}}
151 return _mm256_insert_epi64(__a, 42, 3);
152 }
153
test_mm256_undefined_ps()154 __m256 test_mm256_undefined_ps() {
155 // CHECK-LABEL: @test_mm256_undefined_ps
156 // CHECK: ret <8 x float> undef
157 return _mm256_undefined_ps();
158 }
159
test_mm256_undefined_pd()160 __m256d test_mm256_undefined_pd() {
161 // CHECK-LABEL: @test_mm256_undefined_pd
162 // CHECK: ret <4 x double> undef
163 return _mm256_undefined_pd();
164 }
165
test_mm256_undefined_si256()166 __m256i test_mm256_undefined_si256() {
167 // CHECK-LABEL: @test_mm256_undefined_si256
168 // CHECK: ret <4 x i64> undef
169 return _mm256_undefined_si256();
170 }
171