• Home
  • Raw
  • Download

Lines Matching refs:xmm0

12 ; SSE2-NEXT:    movdqa %xmm0, %xmm1
15 ; SSE2-NEXT: psubq %xmm1, %xmm0
17 ; SSE2-NEXT: movdqa %xmm0, %xmm2
19 ; SSE2-NEXT: psrlq $2, %xmm0
20 ; SSE2-NEXT: pand %xmm1, %xmm0
21 ; SSE2-NEXT: paddq %xmm2, %xmm0
22 ; SSE2-NEXT: movdqa %xmm0, %xmm1
24 ; SSE2-NEXT: paddq %xmm0, %xmm1
26 ; SSE2-NEXT: pxor %xmm0, %xmm0
27 ; SSE2-NEXT: psadbw %xmm0, %xmm1
28 ; SSE2-NEXT: movdqa %xmm1, %xmm0
33 ; SSE3-NEXT: movdqa %xmm0, %xmm1
36 ; SSE3-NEXT: psubq %xmm1, %xmm0
38 ; SSE3-NEXT: movdqa %xmm0, %xmm2
40 ; SSE3-NEXT: psrlq $2, %xmm0
41 ; SSE3-NEXT: pand %xmm1, %xmm0
42 ; SSE3-NEXT: paddq %xmm2, %xmm0
43 ; SSE3-NEXT: movdqa %xmm0, %xmm1
45 ; SSE3-NEXT: paddq %xmm0, %xmm1
47 ; SSE3-NEXT: pxor %xmm0, %xmm0
48 ; SSE3-NEXT: psadbw %xmm0, %xmm1
49 ; SSE3-NEXT: movdqa %xmm1, %xmm0
55 ; SSSE3-NEXT: movdqa %xmm0, %xmm2
60 ; SSSE3-NEXT: psrlw $4, %xmm0
61 ; SSSE3-NEXT: pand %xmm1, %xmm0
62 ; SSSE3-NEXT: pshufb %xmm0, %xmm3
64 ; SSSE3-NEXT: pxor %xmm0, %xmm0
65 ; SSSE3-NEXT: psadbw %xmm3, %xmm0
71 ; SSE41-NEXT: movdqa %xmm0, %xmm2
76 ; SSE41-NEXT: psrlw $4, %xmm0
77 ; SSE41-NEXT: pand %xmm1, %xmm0
78 ; SSE41-NEXT: pshufb %xmm0, %xmm3
80 ; SSE41-NEXT: pxor %xmm0, %xmm0
81 ; SSE41-NEXT: psadbw %xmm3, %xmm0
87 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
90 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm0
91 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
92 ; AVX-NEXT: vpshufb %xmm0, %xmm3, %xmm0
93 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0
95 ; AVX-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
104 ; SSE2-NEXT: movdqa %xmm0, %xmm1
107 ; SSE2-NEXT: psubd %xmm1, %xmm0
109 ; SSE2-NEXT: movdqa %xmm0, %xmm2
111 ; SSE2-NEXT: psrld $2, %xmm0
112 ; SSE2-NEXT: pand %xmm1, %xmm0
113 ; SSE2-NEXT: paddd %xmm2, %xmm0
114 ; SSE2-NEXT: movdqa %xmm0, %xmm1
116 ; SSE2-NEXT: paddd %xmm0, %xmm1
118 ; SSE2-NEXT: pxor %xmm0, %xmm0
120 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm0[2],xmm2[3],xmm0[3]
121 ; SSE2-NEXT: psadbw %xmm0, %xmm2
122 ; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
123 ; SSE2-NEXT: psadbw %xmm0, %xmm1
125 ; SSE2-NEXT: movdqa %xmm1, %xmm0
130 ; SSE3-NEXT: movdqa %xmm0, %xmm1
133 ; SSE3-NEXT: psubd %xmm1, %xmm0
135 ; SSE3-NEXT: movdqa %xmm0, %xmm2
137 ; SSE3-NEXT: psrld $2, %xmm0
138 ; SSE3-NEXT: pand %xmm1, %xmm0
139 ; SSE3-NEXT: paddd %xmm2, %xmm0
140 ; SSE3-NEXT: movdqa %xmm0, %xmm1
142 ; SSE3-NEXT: paddd %xmm0, %xmm1
144 ; SSE3-NEXT: pxor %xmm0, %xmm0
146 ; SSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm0[2],xmm2[3],xmm0[3]
147 ; SSE3-NEXT: psadbw %xmm0, %xmm2
148 ; SSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
149 ; SSE3-NEXT: psadbw %xmm0, %xmm1
151 ; SSE3-NEXT: movdqa %xmm1, %xmm0
157 ; SSSE3-NEXT: movdqa %xmm0, %xmm3
162 ; SSSE3-NEXT: psrlw $4, %xmm0
163 ; SSSE3-NEXT: pand %xmm2, %xmm0
164 ; SSSE3-NEXT: pshufb %xmm0, %xmm1
166 ; SSSE3-NEXT: pxor %xmm0, %xmm0
168 ; SSSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm0[2],xmm2[3],xmm0[3]
169 ; SSSE3-NEXT: psadbw %xmm0, %xmm2
170 ; SSSE3-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
171 ; SSSE3-NEXT: psadbw %xmm0, %xmm1
173 ; SSSE3-NEXT: movdqa %xmm1, %xmm0
179 ; SSE41-NEXT: movdqa %xmm0, %xmm3
184 ; SSE41-NEXT: psrlw $4, %xmm0
185 ; SSE41-NEXT: pand %xmm2, %xmm0
186 ; SSE41-NEXT: pshufb %xmm0, %xmm1
188 ; SSE41-NEXT: pxor %xmm0, %xmm0
190 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm0[2],xmm2[3],xmm0[3]
191 ; SSE41-NEXT: psadbw %xmm0, %xmm2
192 ; SSE41-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
193 ; SSE41-NEXT: psadbw %xmm0, %xmm1
195 ; SSE41-NEXT: movdqa %xmm1, %xmm0
201 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
204 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm0
205 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
206 ; AVX-NEXT: vpshufb %xmm0, %xmm3, %xmm0
207 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0
209 ; AVX-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
211 ; AVX-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
212 ; AVX-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
213 ; AVX-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
222 ; SSE2-NEXT: movdqa %xmm0, %xmm1
225 ; SSE2-NEXT: psubw %xmm1, %xmm0
227 ; SSE2-NEXT: movdqa %xmm0, %xmm2
229 ; SSE2-NEXT: psrlw $2, %xmm0
230 ; SSE2-NEXT: pand %xmm1, %xmm0
231 ; SSE2-NEXT: paddw %xmm2, %xmm0
232 ; SSE2-NEXT: movdqa %xmm0, %xmm1
234 ; SSE2-NEXT: paddw %xmm0, %xmm1
236 ; SSE2-NEXT: movdqa %xmm1, %xmm0
237 ; SSE2-NEXT: psllw $8, %xmm0
238 ; SSE2-NEXT: paddb %xmm1, %xmm0
239 ; SSE2-NEXT: psrlw $8, %xmm0
244 ; SSE3-NEXT: movdqa %xmm0, %xmm1
247 ; SSE3-NEXT: psubw %xmm1, %xmm0
249 ; SSE3-NEXT: movdqa %xmm0, %xmm2
251 ; SSE3-NEXT: psrlw $2, %xmm0
252 ; SSE3-NEXT: pand %xmm1, %xmm0
253 ; SSE3-NEXT: paddw %xmm2, %xmm0
254 ; SSE3-NEXT: movdqa %xmm0, %xmm1
256 ; SSE3-NEXT: paddw %xmm0, %xmm1
258 ; SSE3-NEXT: movdqa %xmm1, %xmm0
259 ; SSE3-NEXT: psllw $8, %xmm0
260 ; SSE3-NEXT: paddb %xmm1, %xmm0
261 ; SSE3-NEXT: psrlw $8, %xmm0
267 ; SSSE3-NEXT: movdqa %xmm0, %xmm2
272 ; SSSE3-NEXT: psrlw $4, %xmm0
273 ; SSSE3-NEXT: pand %xmm1, %xmm0
274 ; SSSE3-NEXT: pshufb %xmm0, %xmm3
276 ; SSSE3-NEXT: movdqa %xmm3, %xmm0
277 ; SSSE3-NEXT: psllw $8, %xmm0
278 ; SSSE3-NEXT: paddb %xmm3, %xmm0
279 ; SSSE3-NEXT: psrlw $8, %xmm0
285 ; SSE41-NEXT: movdqa %xmm0, %xmm2
290 ; SSE41-NEXT: psrlw $4, %xmm0
291 ; SSE41-NEXT: pand %xmm1, %xmm0
292 ; SSE41-NEXT: pshufb %xmm0, %xmm3
294 ; SSE41-NEXT: movdqa %xmm3, %xmm0
295 ; SSE41-NEXT: psllw $8, %xmm0
296 ; SSE41-NEXT: paddb %xmm3, %xmm0
297 ; SSE41-NEXT: psrlw $8, %xmm0
303 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
306 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm0
307 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
308 ; AVX-NEXT: vpshufb %xmm0, %xmm3, %xmm0
309 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0
310 ; AVX-NEXT: vpsllw $8, %xmm0, %xmm1
311 ; AVX-NEXT: vpaddb %xmm0, %xmm1, %xmm0
312 ; AVX-NEXT: vpsrlw $8, %xmm0, %xmm0
321 ; SSE2-NEXT: movdqa %xmm0, %xmm1
324 ; SSE2-NEXT: psubb %xmm1, %xmm0
326 ; SSE2-NEXT: movdqa %xmm0, %xmm2
328 ; SSE2-NEXT: psrlw $2, %xmm0
329 ; SSE2-NEXT: pand %xmm1, %xmm0
330 ; SSE2-NEXT: paddb %xmm2, %xmm0
331 ; SSE2-NEXT: movdqa %xmm0, %xmm1
333 ; SSE2-NEXT: paddb %xmm0, %xmm1
335 ; SSE2-NEXT: movdqa %xmm1, %xmm0
340 ; SSE3-NEXT: movdqa %xmm0, %xmm1
343 ; SSE3-NEXT: psubb %xmm1, %xmm0
345 ; SSE3-NEXT: movdqa %xmm0, %xmm2
347 ; SSE3-NEXT: psrlw $2, %xmm0
348 ; SSE3-NEXT: pand %xmm1, %xmm0
349 ; SSE3-NEXT: paddb %xmm2, %xmm0
350 ; SSE3-NEXT: movdqa %xmm0, %xmm1
352 ; SSE3-NEXT: paddb %xmm0, %xmm1
354 ; SSE3-NEXT: movdqa %xmm1, %xmm0
360 ; SSSE3-NEXT: movdqa %xmm0, %xmm3
365 ; SSSE3-NEXT: psrlw $4, %xmm0
366 ; SSSE3-NEXT: pand %xmm2, %xmm0
367 ; SSSE3-NEXT: pshufb %xmm0, %xmm1
369 ; SSSE3-NEXT: movdqa %xmm1, %xmm0
375 ; SSE41-NEXT: movdqa %xmm0, %xmm3
380 ; SSE41-NEXT: psrlw $4, %xmm0
381 ; SSE41-NEXT: pand %xmm2, %xmm0
382 ; SSE41-NEXT: pshufb %xmm0, %xmm1
384 ; SSE41-NEXT: movdqa %xmm1, %xmm0
390 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
393 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm0
394 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
395 ; AVX-NEXT: vpshufb %xmm0, %xmm3, %xmm0
396 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0
405 ; SSE-NEXT: movaps {{.*#+}} xmm0 = [1,64]
410 ; AVX-NEXT: vmovaps {{.*#+}} xmm0 = [1,64]
419 ; SSE-NEXT: movaps {{.*#+}} xmm0 = [1,32,0,8]
424 ; AVX-NEXT: vmovaps {{.*#+}} xmm0 = [1,32,0,8]
433 ; SSE-NEXT: movaps {{.*#+}} xmm0 = [1,16,0,8,0,3,2,3]
438 ; AVX-NEXT: vmovaps {{.*#+}} xmm0 = [1,16,0,8,0,3,2,3]
447 ; SSE-NEXT: movaps {{.*#+}} xmm0 = [0,8,0,8,0,3,2,3,7,7,1,1,1,1,1,1]
452 ; AVX-NEXT: vmovaps {{.*#+}} xmm0 = [0,8,0,8,0,3,2,3,7,7,1,1,1,1,1,1]