Lines Matching refs:xmm2
158 ; SSE2-NEXT: pxor %xmm2, %xmm2
159 ; SSE2-NEXT: psubd %xmm0, %xmm2
160 ; SSE2-NEXT: pand %xmm0, %xmm2
161 ; SSE2-NEXT: psubd {{.*}}(%rip), %xmm2
162 ; SSE2-NEXT: movdqa %xmm2, %xmm0
165 ; SSE2-NEXT: psubd %xmm0, %xmm2
167 ; SSE2-NEXT: movdqa %xmm2, %xmm3
169 ; SSE2-NEXT: psrld $2, %xmm2
170 ; SSE2-NEXT: pand %xmm0, %xmm2
171 ; SSE2-NEXT: paddd %xmm3, %xmm2
172 ; SSE2-NEXT: movdqa %xmm2, %xmm0
174 ; SSE2-NEXT: paddd %xmm2, %xmm0
176 ; SSE2-NEXT: movdqa %xmm0, %xmm2
177 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
178 ; SSE2-NEXT: psadbw %xmm1, %xmm2
181 ; SSE2-NEXT: packuswb %xmm2, %xmm0
187 ; SSE3-NEXT: pxor %xmm2, %xmm2
188 ; SSE3-NEXT: psubd %xmm0, %xmm2
189 ; SSE3-NEXT: pand %xmm0, %xmm2
190 ; SSE3-NEXT: psubd {{.*}}(%rip), %xmm2
191 ; SSE3-NEXT: movdqa %xmm2, %xmm0
194 ; SSE3-NEXT: psubd %xmm0, %xmm2
196 ; SSE3-NEXT: movdqa %xmm2, %xmm3
198 ; SSE3-NEXT: psrld $2, %xmm2
199 ; SSE3-NEXT: pand %xmm0, %xmm2
200 ; SSE3-NEXT: paddd %xmm3, %xmm2
201 ; SSE3-NEXT: movdqa %xmm2, %xmm0
203 ; SSE3-NEXT: paddd %xmm2, %xmm0
205 ; SSE3-NEXT: movdqa %xmm0, %xmm2
206 ; SSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
207 ; SSE3-NEXT: psadbw %xmm1, %xmm2
210 ; SSE3-NEXT: packuswb %xmm2, %xmm0
216 ; SSSE3-NEXT: pxor %xmm2, %xmm2
217 ; SSSE3-NEXT: psubd %xmm0, %xmm2
218 ; SSSE3-NEXT: pand %xmm0, %xmm2
219 ; SSSE3-NEXT: psubd {{.*}}(%rip), %xmm2
221 ; SSSE3-NEXT: movdqa %xmm2, %xmm4
226 ; SSSE3-NEXT: psrlw $4, %xmm2
227 ; SSSE3-NEXT: pand %xmm3, %xmm2
228 ; SSSE3-NEXT: pshufb %xmm2, %xmm0
230 ; SSSE3-NEXT: movdqa %xmm0, %xmm2
231 ; SSSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
232 ; SSSE3-NEXT: psadbw %xmm1, %xmm2
235 ; SSSE3-NEXT: packuswb %xmm2, %xmm0
241 ; SSE41-NEXT: pxor %xmm2, %xmm2
242 ; SSE41-NEXT: psubd %xmm0, %xmm2
243 ; SSE41-NEXT: pand %xmm0, %xmm2
244 ; SSE41-NEXT: psubd {{.*}}(%rip), %xmm2
246 ; SSE41-NEXT: movdqa %xmm2, %xmm4
251 ; SSE41-NEXT: psrlw $4, %xmm2
252 ; SSE41-NEXT: pand %xmm3, %xmm2
253 ; SSE41-NEXT: pshufb %xmm2, %xmm0
255 ; SSE41-NEXT: movdqa %xmm0, %xmm2
256 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
257 ; SSE41-NEXT: psadbw %xmm1, %xmm2
260 ; SSE41-NEXT: packuswb %xmm2, %xmm0
266 ; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm2
267 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
269 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
270 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm3
274 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
277 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
278 ; AVX1-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
281 ; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
287 ; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm2
288 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
289 ; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %xmm2
290 ; AVX2-NEXT: vpsubd %xmm2, %xmm0, %xmm0
291 ; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
292 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm3
296 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
299 ; AVX2-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
300 ; AVX2-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
303 ; AVX2-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
313 ; SSE2-NEXT: pxor %xmm2, %xmm2
314 ; SSE2-NEXT: psubd %xmm0, %xmm2
315 ; SSE2-NEXT: pand %xmm0, %xmm2
316 ; SSE2-NEXT: psubd {{.*}}(%rip), %xmm2
317 ; SSE2-NEXT: movdqa %xmm2, %xmm0
320 ; SSE2-NEXT: psubd %xmm0, %xmm2
322 ; SSE2-NEXT: movdqa %xmm2, %xmm3
324 ; SSE2-NEXT: psrld $2, %xmm2
325 ; SSE2-NEXT: pand %xmm0, %xmm2
326 ; SSE2-NEXT: paddd %xmm3, %xmm2
327 ; SSE2-NEXT: movdqa %xmm2, %xmm0
329 ; SSE2-NEXT: paddd %xmm2, %xmm0
331 ; SSE2-NEXT: movdqa %xmm0, %xmm2
332 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
333 ; SSE2-NEXT: psadbw %xmm1, %xmm2
336 ; SSE2-NEXT: packuswb %xmm2, %xmm0
342 ; SSE3-NEXT: pxor %xmm2, %xmm2
343 ; SSE3-NEXT: psubd %xmm0, %xmm2
344 ; SSE3-NEXT: pand %xmm0, %xmm2
345 ; SSE3-NEXT: psubd {{.*}}(%rip), %xmm2
346 ; SSE3-NEXT: movdqa %xmm2, %xmm0
349 ; SSE3-NEXT: psubd %xmm0, %xmm2
351 ; SSE3-NEXT: movdqa %xmm2, %xmm3
353 ; SSE3-NEXT: psrld $2, %xmm2
354 ; SSE3-NEXT: pand %xmm0, %xmm2
355 ; SSE3-NEXT: paddd %xmm3, %xmm2
356 ; SSE3-NEXT: movdqa %xmm2, %xmm0
358 ; SSE3-NEXT: paddd %xmm2, %xmm0
360 ; SSE3-NEXT: movdqa %xmm0, %xmm2
361 ; SSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
362 ; SSE3-NEXT: psadbw %xmm1, %xmm2
365 ; SSE3-NEXT: packuswb %xmm2, %xmm0
371 ; SSSE3-NEXT: pxor %xmm2, %xmm2
372 ; SSSE3-NEXT: psubd %xmm0, %xmm2
373 ; SSSE3-NEXT: pand %xmm0, %xmm2
374 ; SSSE3-NEXT: psubd {{.*}}(%rip), %xmm2
376 ; SSSE3-NEXT: movdqa %xmm2, %xmm4
381 ; SSSE3-NEXT: psrlw $4, %xmm2
382 ; SSSE3-NEXT: pand %xmm3, %xmm2
383 ; SSSE3-NEXT: pshufb %xmm2, %xmm0
385 ; SSSE3-NEXT: movdqa %xmm0, %xmm2
386 ; SSSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
387 ; SSSE3-NEXT: psadbw %xmm1, %xmm2
390 ; SSSE3-NEXT: packuswb %xmm2, %xmm0
396 ; SSE41-NEXT: pxor %xmm2, %xmm2
397 ; SSE41-NEXT: psubd %xmm0, %xmm2
398 ; SSE41-NEXT: pand %xmm0, %xmm2
399 ; SSE41-NEXT: psubd {{.*}}(%rip), %xmm2
401 ; SSE41-NEXT: movdqa %xmm2, %xmm4
406 ; SSE41-NEXT: psrlw $4, %xmm2
407 ; SSE41-NEXT: pand %xmm3, %xmm2
408 ; SSE41-NEXT: pshufb %xmm2, %xmm0
410 ; SSE41-NEXT: movdqa %xmm0, %xmm2
411 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
412 ; SSE41-NEXT: psadbw %xmm1, %xmm2
415 ; SSE41-NEXT: packuswb %xmm2, %xmm0
421 ; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm2
422 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
424 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
425 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm3
429 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
432 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
433 ; AVX1-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
436 ; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
442 ; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm2
443 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
444 ; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %xmm2
445 ; AVX2-NEXT: vpsubd %xmm2, %xmm0, %xmm0
446 ; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
447 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm3
451 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
454 ; AVX2-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
455 ; AVX2-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
458 ; AVX2-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
476 ; SSE2-NEXT: movdqa %xmm1, %xmm2
477 ; SSE2-NEXT: pand %xmm0, %xmm2
480 ; SSE2-NEXT: paddw %xmm2, %xmm1
481 ; SSE2-NEXT: movdqa %xmm1, %xmm2
482 ; SSE2-NEXT: psrlw $4, %xmm2
483 ; SSE2-NEXT: paddw %xmm1, %xmm2
484 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm2
485 ; SSE2-NEXT: movdqa %xmm2, %xmm0
487 ; SSE2-NEXT: paddb %xmm2, %xmm0
502 ; SSE3-NEXT: movdqa %xmm1, %xmm2
503 ; SSE3-NEXT: pand %xmm0, %xmm2
506 ; SSE3-NEXT: paddw %xmm2, %xmm1
507 ; SSE3-NEXT: movdqa %xmm1, %xmm2
508 ; SSE3-NEXT: psrlw $4, %xmm2
509 ; SSE3-NEXT: paddw %xmm1, %xmm2
510 ; SSE3-NEXT: pand {{.*}}(%rip), %xmm2
511 ; SSE3-NEXT: movdqa %xmm2, %xmm0
513 ; SSE3-NEXT: paddb %xmm2, %xmm0
524 ; SSSE3-NEXT: movdqa %xmm1, %xmm2
525 ; SSSE3-NEXT: pand %xmm0, %xmm2
528 ; SSSE3-NEXT: pshufb %xmm2, %xmm4
546 ; SSE41-NEXT: movdqa %xmm1, %xmm2
547 ; SSE41-NEXT: pand %xmm0, %xmm2
550 ; SSE41-NEXT: pshufb %xmm2, %xmm4
568 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
570 ; AVX-NEXT: vpshufb %xmm2, %xmm3, %xmm2
574 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0
595 ; SSE2-NEXT: movdqa %xmm1, %xmm2
596 ; SSE2-NEXT: pand %xmm0, %xmm2
599 ; SSE2-NEXT: paddw %xmm2, %xmm1
600 ; SSE2-NEXT: movdqa %xmm1, %xmm2
601 ; SSE2-NEXT: psrlw $4, %xmm2
602 ; SSE2-NEXT: paddw %xmm1, %xmm2
603 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm2
604 ; SSE2-NEXT: movdqa %xmm2, %xmm0
606 ; SSE2-NEXT: paddb %xmm2, %xmm0
621 ; SSE3-NEXT: movdqa %xmm1, %xmm2
622 ; SSE3-NEXT: pand %xmm0, %xmm2
625 ; SSE3-NEXT: paddw %xmm2, %xmm1
626 ; SSE3-NEXT: movdqa %xmm1, %xmm2
627 ; SSE3-NEXT: psrlw $4, %xmm2
628 ; SSE3-NEXT: paddw %xmm1, %xmm2
629 ; SSE3-NEXT: pand {{.*}}(%rip), %xmm2
630 ; SSE3-NEXT: movdqa %xmm2, %xmm0
632 ; SSE3-NEXT: paddb %xmm2, %xmm0
643 ; SSSE3-NEXT: movdqa %xmm1, %xmm2
644 ; SSSE3-NEXT: pand %xmm0, %xmm2
647 ; SSSE3-NEXT: pshufb %xmm2, %xmm4
665 ; SSE41-NEXT: movdqa %xmm1, %xmm2
666 ; SSE41-NEXT: pand %xmm0, %xmm2
669 ; SSE41-NEXT: pshufb %xmm2, %xmm4
687 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
689 ; AVX-NEXT: vpshufb %xmm2, %xmm3, %xmm2
693 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0
714 ; SSE2-NEXT: movdqa %xmm1, %xmm2
715 ; SSE2-NEXT: pand %xmm0, %xmm2
718 ; SSE2-NEXT: paddb %xmm2, %xmm1
736 ; SSE3-NEXT: movdqa %xmm1, %xmm2
737 ; SSE3-NEXT: pand %xmm0, %xmm2
740 ; SSE3-NEXT: paddb %xmm2, %xmm1
753 ; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
755 ; SSSE3-NEXT: pand %xmm2, %xmm3
760 ; SSSE3-NEXT: pand %xmm2, %xmm1
771 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
773 ; SSE41-NEXT: pand %xmm2, %xmm3
778 ; SSE41-NEXT: pand %xmm2, %xmm1
790 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
792 ; AVX-NEXT: vpshufb %xmm2, %xmm3, %xmm2
796 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0
814 ; SSE2-NEXT: movdqa %xmm1, %xmm2
815 ; SSE2-NEXT: pand %xmm0, %xmm2
818 ; SSE2-NEXT: paddb %xmm2, %xmm1
836 ; SSE3-NEXT: movdqa %xmm1, %xmm2
837 ; SSE3-NEXT: pand %xmm0, %xmm2
840 ; SSE3-NEXT: paddb %xmm2, %xmm1
853 ; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
855 ; SSSE3-NEXT: pand %xmm2, %xmm3
860 ; SSSE3-NEXT: pand %xmm2, %xmm1
871 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
873 ; SSE41-NEXT: pand %xmm2, %xmm3
878 ; SSE41-NEXT: pand %xmm2, %xmm1
890 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
892 ; AVX-NEXT: vpshufb %xmm2, %xmm3, %xmm2
896 ; AVX-NEXT: vpaddb %xmm2, %xmm0, %xmm0