• Home
  • Raw
  • Download

Lines Matching refs:xmm2

241 ; SSE2-NEXT:    pxor %xmm2, %xmm2
242 ; SSE2-NEXT: psubd %xmm0, %xmm2
243 ; SSE2-NEXT: pand %xmm0, %xmm2
244 ; SSE2-NEXT: psubd {{.*}}(%rip), %xmm2
245 ; SSE2-NEXT: movdqa %xmm2, %xmm0
248 ; SSE2-NEXT: psubd %xmm0, %xmm2
250 ; SSE2-NEXT: movdqa %xmm2, %xmm3
252 ; SSE2-NEXT: psrld $2, %xmm2
253 ; SSE2-NEXT: pand %xmm0, %xmm2
254 ; SSE2-NEXT: paddd %xmm3, %xmm2
255 ; SSE2-NEXT: movdqa %xmm2, %xmm0
257 ; SSE2-NEXT: paddd %xmm2, %xmm0
259 ; SSE2-NEXT: movdqa %xmm0, %xmm2
260 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
261 ; SSE2-NEXT: psadbw %xmm1, %xmm2
264 ; SSE2-NEXT: packuswb %xmm2, %xmm0
270 ; SSE3-NEXT: pxor %xmm2, %xmm2
271 ; SSE3-NEXT: psubd %xmm0, %xmm2
272 ; SSE3-NEXT: pand %xmm0, %xmm2
273 ; SSE3-NEXT: psubd {{.*}}(%rip), %xmm2
274 ; SSE3-NEXT: movdqa %xmm2, %xmm0
277 ; SSE3-NEXT: psubd %xmm0, %xmm2
279 ; SSE3-NEXT: movdqa %xmm2, %xmm3
281 ; SSE3-NEXT: psrld $2, %xmm2
282 ; SSE3-NEXT: pand %xmm0, %xmm2
283 ; SSE3-NEXT: paddd %xmm3, %xmm2
284 ; SSE3-NEXT: movdqa %xmm2, %xmm0
286 ; SSE3-NEXT: paddd %xmm2, %xmm0
288 ; SSE3-NEXT: movdqa %xmm0, %xmm2
289 ; SSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
290 ; SSE3-NEXT: psadbw %xmm1, %xmm2
293 ; SSE3-NEXT: packuswb %xmm2, %xmm0
299 ; SSSE3-NEXT: pxor %xmm2, %xmm2
300 ; SSSE3-NEXT: psubd %xmm0, %xmm2
301 ; SSSE3-NEXT: pand %xmm0, %xmm2
302 ; SSSE3-NEXT: psubd {{.*}}(%rip), %xmm2
304 ; SSSE3-NEXT: movdqa %xmm2, %xmm4
309 ; SSSE3-NEXT: psrlw $4, %xmm2
310 ; SSSE3-NEXT: pand %xmm3, %xmm2
311 ; SSSE3-NEXT: pshufb %xmm2, %xmm0
313 ; SSSE3-NEXT: movdqa %xmm0, %xmm2
314 ; SSSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
315 ; SSSE3-NEXT: psadbw %xmm1, %xmm2
318 ; SSSE3-NEXT: packuswb %xmm2, %xmm0
324 ; SSE41-NEXT: pxor %xmm2, %xmm2
325 ; SSE41-NEXT: psubd %xmm0, %xmm2
326 ; SSE41-NEXT: pand %xmm0, %xmm2
327 ; SSE41-NEXT: psubd {{.*}}(%rip), %xmm2
329 ; SSE41-NEXT: movdqa %xmm2, %xmm4
334 ; SSE41-NEXT: psrlw $4, %xmm2
335 ; SSE41-NEXT: pand %xmm3, %xmm2
336 ; SSE41-NEXT: pshufb %xmm2, %xmm0
338 ; SSE41-NEXT: movdqa %xmm0, %xmm2
339 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
340 ; SSE41-NEXT: psadbw %xmm1, %xmm2
343 ; SSE41-NEXT: packuswb %xmm2, %xmm0
349 ; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm2
350 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
352 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
353 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm3
357 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
360 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
361 ; AVX1-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
364 ; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
370 ; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm2
371 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
372 ; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %xmm2
373 ; AVX2-NEXT: vpsubd %xmm2, %xmm0, %xmm0
374 ; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
375 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm3
379 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
382 ; AVX2-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
383 ; AVX2-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
386 ; AVX2-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
392 ; AVX512CDVL-NEXT: vpsubd %xmm0, %xmm1, %xmm2
393 ; AVX512CDVL-NEXT: vpandd %xmm2, %xmm0, %xmm0
395 ; AVX512CDVL-NEXT: vmovdqa64 {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
396 ; AVX512CDVL-NEXT: vpandq %xmm2, %xmm0, %xmm3
400 ; AVX512CDVL-NEXT: vpandq %xmm2, %xmm0, %xmm0
403 ; AVX512CDVL-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
404 ; AVX512CDVL-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
407 ; AVX512CDVL-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
413 ; AVX512CD-NEXT: vpsubd %xmm0, %xmm1, %xmm2
414 ; AVX512CD-NEXT: vpand %xmm2, %xmm0, %xmm0
415 ; AVX512CD-NEXT: vpbroadcastd {{.*}}(%rip), %xmm2
416 ; AVX512CD-NEXT: vpsubd %xmm2, %xmm0, %xmm0
417 ; AVX512CD-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
418 ; AVX512CD-NEXT: vpand %xmm2, %xmm0, %xmm3
422 ; AVX512CD-NEXT: vpand %xmm2, %xmm0, %xmm0
425 ; AVX512CD-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
426 ; AVX512CD-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
429 ; AVX512CD-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
435 ; X32-SSE-NEXT: pxor %xmm2, %xmm2
436 ; X32-SSE-NEXT: psubd %xmm0, %xmm2
437 ; X32-SSE-NEXT: pand %xmm0, %xmm2
438 ; X32-SSE-NEXT: psubd {{\.LCPI.*}}, %xmm2
440 ; X32-SSE-NEXT: movdqa %xmm2, %xmm4
445 ; X32-SSE-NEXT: psrlw $4, %xmm2
446 ; X32-SSE-NEXT: pand %xmm3, %xmm2
447 ; X32-SSE-NEXT: pshufb %xmm2, %xmm0
449 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
450 ; X32-SSE-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
451 ; X32-SSE-NEXT: psadbw %xmm1, %xmm2
454 ; X32-SSE-NEXT: packuswb %xmm2, %xmm0
464 ; SSE2-NEXT: pxor %xmm2, %xmm2
465 ; SSE2-NEXT: psubd %xmm0, %xmm2
466 ; SSE2-NEXT: pand %xmm0, %xmm2
467 ; SSE2-NEXT: psubd {{.*}}(%rip), %xmm2
468 ; SSE2-NEXT: movdqa %xmm2, %xmm0
471 ; SSE2-NEXT: psubd %xmm0, %xmm2
473 ; SSE2-NEXT: movdqa %xmm2, %xmm3
475 ; SSE2-NEXT: psrld $2, %xmm2
476 ; SSE2-NEXT: pand %xmm0, %xmm2
477 ; SSE2-NEXT: paddd %xmm3, %xmm2
478 ; SSE2-NEXT: movdqa %xmm2, %xmm0
480 ; SSE2-NEXT: paddd %xmm2, %xmm0
482 ; SSE2-NEXT: movdqa %xmm0, %xmm2
483 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
484 ; SSE2-NEXT: psadbw %xmm1, %xmm2
487 ; SSE2-NEXT: packuswb %xmm2, %xmm0
493 ; SSE3-NEXT: pxor %xmm2, %xmm2
494 ; SSE3-NEXT: psubd %xmm0, %xmm2
495 ; SSE3-NEXT: pand %xmm0, %xmm2
496 ; SSE3-NEXT: psubd {{.*}}(%rip), %xmm2
497 ; SSE3-NEXT: movdqa %xmm2, %xmm0
500 ; SSE3-NEXT: psubd %xmm0, %xmm2
502 ; SSE3-NEXT: movdqa %xmm2, %xmm3
504 ; SSE3-NEXT: psrld $2, %xmm2
505 ; SSE3-NEXT: pand %xmm0, %xmm2
506 ; SSE3-NEXT: paddd %xmm3, %xmm2
507 ; SSE3-NEXT: movdqa %xmm2, %xmm0
509 ; SSE3-NEXT: paddd %xmm2, %xmm0
511 ; SSE3-NEXT: movdqa %xmm0, %xmm2
512 ; SSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
513 ; SSE3-NEXT: psadbw %xmm1, %xmm2
516 ; SSE3-NEXT: packuswb %xmm2, %xmm0
522 ; SSSE3-NEXT: pxor %xmm2, %xmm2
523 ; SSSE3-NEXT: psubd %xmm0, %xmm2
524 ; SSSE3-NEXT: pand %xmm0, %xmm2
525 ; SSSE3-NEXT: psubd {{.*}}(%rip), %xmm2
527 ; SSSE3-NEXT: movdqa %xmm2, %xmm4
532 ; SSSE3-NEXT: psrlw $4, %xmm2
533 ; SSSE3-NEXT: pand %xmm3, %xmm2
534 ; SSSE3-NEXT: pshufb %xmm2, %xmm0
536 ; SSSE3-NEXT: movdqa %xmm0, %xmm2
537 ; SSSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
538 ; SSSE3-NEXT: psadbw %xmm1, %xmm2
541 ; SSSE3-NEXT: packuswb %xmm2, %xmm0
547 ; SSE41-NEXT: pxor %xmm2, %xmm2
548 ; SSE41-NEXT: psubd %xmm0, %xmm2
549 ; SSE41-NEXT: pand %xmm0, %xmm2
550 ; SSE41-NEXT: psubd {{.*}}(%rip), %xmm2
552 ; SSE41-NEXT: movdqa %xmm2, %xmm4
557 ; SSE41-NEXT: psrlw $4, %xmm2
558 ; SSE41-NEXT: pand %xmm3, %xmm2
559 ; SSE41-NEXT: pshufb %xmm2, %xmm0
561 ; SSE41-NEXT: movdqa %xmm0, %xmm2
562 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
563 ; SSE41-NEXT: psadbw %xmm1, %xmm2
566 ; SSE41-NEXT: packuswb %xmm2, %xmm0
572 ; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm2
573 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
575 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
576 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm3
580 ; AVX1-NEXT: vpand %xmm2, %xmm0, %xmm0
583 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
584 ; AVX1-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
587 ; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
593 ; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm2
594 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
595 ; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %xmm2
596 ; AVX2-NEXT: vpsubd %xmm2, %xmm0, %xmm0
597 ; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
598 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm3
602 ; AVX2-NEXT: vpand %xmm2, %xmm0, %xmm0
605 ; AVX2-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
606 ; AVX2-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
609 ; AVX2-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
635 ; X32-SSE-NEXT: pxor %xmm2, %xmm2
636 ; X32-SSE-NEXT: psubd %xmm0, %xmm2
637 ; X32-SSE-NEXT: pand %xmm0, %xmm2
638 ; X32-SSE-NEXT: psubd {{\.LCPI.*}}, %xmm2
640 ; X32-SSE-NEXT: movdqa %xmm2, %xmm4
645 ; X32-SSE-NEXT: psrlw $4, %xmm2
646 ; X32-SSE-NEXT: pand %xmm3, %xmm2
647 ; X32-SSE-NEXT: pshufb %xmm2, %xmm0
649 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
650 ; X32-SSE-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
651 ; X32-SSE-NEXT: psadbw %xmm1, %xmm2
654 ; X32-SSE-NEXT: packuswb %xmm2, %xmm0
672 ; SSE2-NEXT: movdqa %xmm1, %xmm2
673 ; SSE2-NEXT: pand %xmm0, %xmm2
676 ; SSE2-NEXT: paddw %xmm2, %xmm1
677 ; SSE2-NEXT: movdqa %xmm1, %xmm2
678 ; SSE2-NEXT: psrlw $4, %xmm2
679 ; SSE2-NEXT: paddw %xmm1, %xmm2
680 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm2
681 ; SSE2-NEXT: movdqa %xmm2, %xmm0
683 ; SSE2-NEXT: paddb %xmm2, %xmm0
698 ; SSE3-NEXT: movdqa %xmm1, %xmm2
699 ; SSE3-NEXT: pand %xmm0, %xmm2
702 ; SSE3-NEXT: paddw %xmm2, %xmm1
703 ; SSE3-NEXT: movdqa %xmm1, %xmm2
704 ; SSE3-NEXT: psrlw $4, %xmm2
705 ; SSE3-NEXT: paddw %xmm1, %xmm2
706 ; SSE3-NEXT: pand {{.*}}(%rip), %xmm2
707 ; SSE3-NEXT: movdqa %xmm2, %xmm0
709 ; SSE3-NEXT: paddb %xmm2, %xmm0
720 ; SSSE3-NEXT: movdqa %xmm1, %xmm2
721 ; SSSE3-NEXT: pand %xmm0, %xmm2
724 ; SSSE3-NEXT: pshufb %xmm2, %xmm4
742 ; SSE41-NEXT: movdqa %xmm1, %xmm2
743 ; SSE41-NEXT: pand %xmm0, %xmm2
746 ; SSE41-NEXT: pshufb %xmm2, %xmm4
764 ; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm2
766 ; AVX1-NEXT: vpshufb %xmm2, %xmm3, %xmm2
770 ; AVX1-NEXT: vpaddb %xmm2, %xmm0, %xmm0
783 ; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm2
785 ; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
789 ; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
802 ; AVX512CDVL-NEXT: vpandq %xmm1, %xmm0, %xmm2
804 ; AVX512CDVL-NEXT: vpshufb %xmm2, %xmm3, %xmm2
808 ; AVX512CDVL-NEXT: vpaddb %xmm2, %xmm0, %xmm0
821 ; AVX512CD-NEXT: vpand %xmm1, %xmm0, %xmm2
823 ; AVX512CD-NEXT: vpshufb %xmm2, %xmm3, %xmm2
827 ; AVX512CD-NEXT: vpaddb %xmm2, %xmm0, %xmm0
840 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
841 ; X32-SSE-NEXT: pand %xmm0, %xmm2
844 ; X32-SSE-NEXT: pshufb %xmm2, %xmm4
870 ; SSE2-NEXT: movdqa %xmm1, %xmm2
871 ; SSE2-NEXT: pand %xmm0, %xmm2
874 ; SSE2-NEXT: paddw %xmm2, %xmm1
875 ; SSE2-NEXT: movdqa %xmm1, %xmm2
876 ; SSE2-NEXT: psrlw $4, %xmm2
877 ; SSE2-NEXT: paddw %xmm1, %xmm2
878 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm2
879 ; SSE2-NEXT: movdqa %xmm2, %xmm0
881 ; SSE2-NEXT: paddb %xmm2, %xmm0
896 ; SSE3-NEXT: movdqa %xmm1, %xmm2
897 ; SSE3-NEXT: pand %xmm0, %xmm2
900 ; SSE3-NEXT: paddw %xmm2, %xmm1
901 ; SSE3-NEXT: movdqa %xmm1, %xmm2
902 ; SSE3-NEXT: psrlw $4, %xmm2
903 ; SSE3-NEXT: paddw %xmm1, %xmm2
904 ; SSE3-NEXT: pand {{.*}}(%rip), %xmm2
905 ; SSE3-NEXT: movdqa %xmm2, %xmm0
907 ; SSE3-NEXT: paddb %xmm2, %xmm0
918 ; SSSE3-NEXT: movdqa %xmm1, %xmm2
919 ; SSSE3-NEXT: pand %xmm0, %xmm2
922 ; SSSE3-NEXT: pshufb %xmm2, %xmm4
940 ; SSE41-NEXT: movdqa %xmm1, %xmm2
941 ; SSE41-NEXT: pand %xmm0, %xmm2
944 ; SSE41-NEXT: pshufb %xmm2, %xmm4
962 ; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm2
964 ; AVX1-NEXT: vpshufb %xmm2, %xmm3, %xmm2
968 ; AVX1-NEXT: vpaddb %xmm2, %xmm0, %xmm0
981 ; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm2
983 ; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
987 ; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1000 ; AVX512CDVL-NEXT: vpandq %xmm1, %xmm0, %xmm2
1002 ; AVX512CDVL-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1006 ; AVX512CDVL-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1019 ; AVX512CD-NEXT: vpand %xmm1, %xmm0, %xmm2
1021 ; AVX512CD-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1025 ; AVX512CD-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1038 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
1039 ; X32-SSE-NEXT: pand %xmm0, %xmm2
1042 ; X32-SSE-NEXT: pshufb %xmm2, %xmm4
1068 ; SSE2-NEXT: movdqa %xmm1, %xmm2
1069 ; SSE2-NEXT: pand %xmm0, %xmm2
1072 ; SSE2-NEXT: paddb %xmm2, %xmm1
1090 ; SSE3-NEXT: movdqa %xmm1, %xmm2
1091 ; SSE3-NEXT: pand %xmm0, %xmm2
1094 ; SSE3-NEXT: paddb %xmm2, %xmm1
1107 ; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
1109 ; SSSE3-NEXT: pand %xmm2, %xmm3
1114 ; SSSE3-NEXT: pand %xmm2, %xmm1
1125 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
1127 ; SSE41-NEXT: pand %xmm2, %xmm3
1132 ; SSE41-NEXT: pand %xmm2, %xmm1
1144 ; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm2
1146 ; AVX1-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1150 ; AVX1-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1160 ; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm2
1162 ; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1166 ; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1176 ; AVX512CDVL-NEXT: vpandq %xmm1, %xmm0, %xmm2
1178 ; AVX512CDVL-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1182 ; AVX512CDVL-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1192 ; AVX512CD-NEXT: vpand %xmm1, %xmm0, %xmm2
1194 ; AVX512CD-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1198 ; AVX512CD-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1207 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
1209 ; X32-SSE-NEXT: pand %xmm2, %xmm3
1214 ; X32-SSE-NEXT: pand %xmm2, %xmm1
1234 ; SSE2-NEXT: movdqa %xmm1, %xmm2
1235 ; SSE2-NEXT: pand %xmm0, %xmm2
1238 ; SSE2-NEXT: paddb %xmm2, %xmm1
1256 ; SSE3-NEXT: movdqa %xmm1, %xmm2
1257 ; SSE3-NEXT: pand %xmm0, %xmm2
1260 ; SSE3-NEXT: paddb %xmm2, %xmm1
1273 ; SSSE3-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
1275 ; SSSE3-NEXT: pand %xmm2, %xmm3
1280 ; SSSE3-NEXT: pand %xmm2, %xmm1
1291 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
1293 ; SSE41-NEXT: pand %xmm2, %xmm3
1298 ; SSE41-NEXT: pand %xmm2, %xmm1
1310 ; AVX1-NEXT: vpand %xmm1, %xmm0, %xmm2
1312 ; AVX1-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1316 ; AVX1-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1326 ; AVX2-NEXT: vpand %xmm1, %xmm0, %xmm2
1328 ; AVX2-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1332 ; AVX2-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1342 ; AVX512CDVL-NEXT: vpandq %xmm1, %xmm0, %xmm2
1344 ; AVX512CDVL-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1348 ; AVX512CDVL-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1358 ; AVX512CD-NEXT: vpand %xmm1, %xmm0, %xmm2
1360 ; AVX512CD-NEXT: vpshufb %xmm2, %xmm3, %xmm2
1364 ; AVX512CD-NEXT: vpaddb %xmm2, %xmm0, %xmm0
1373 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm2 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
1375 ; X32-SSE-NEXT: pand %xmm2, %xmm3
1380 ; X32-SSE-NEXT: pand %xmm2, %xmm1