• Home
  • Raw
  • Download

Lines Matching refs:xmm1

19 ; SSE2-NEXT:    pshufd {{.*#+}} xmm3 = xmm1[2,3,0,1]
22 ; SSE2-NEXT: psrlq %xmm1, %xmm0
30 ; SSE41-NEXT: psrlq %xmm1, %xmm2
31 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,3,0,1]
32 ; SSE41-NEXT: psrlq %xmm1, %xmm0
38 ; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm2
39 ; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,3,0,1]
40 ; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
46 ; AVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0
52 ; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1
53 ; XOPAVX1-NEXT: vpshlq %xmm1, %xmm0, %xmm0
58 ; XOPAVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0
63 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm1[2,3,0,1]
66 ; X32-SSE-NEXT: movq {{.*#+}} xmm1 = xmm1[0],zero
67 ; X32-SSE-NEXT: psrlq %xmm1, %xmm0
78 ; SSE2-NEXT: movdqa %xmm1, %xmm2
82 ; SSE2-NEXT: movdqa %xmm1, %xmm2
89 ; SSE2-NEXT: movdqa %xmm1, %xmm4
93 ; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1]
94 ; SSE2-NEXT: psrld %xmm1, %xmm0
102 ; SSE41-NEXT: movdqa %xmm1, %xmm2
106 ; SSE41-NEXT: movdqa %xmm1, %xmm2
112 ; SSE41-NEXT: pmovzxdq {{.*#+}} xmm3 = xmm1[0],zero,xmm1[1],zero
113 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm1 = xmm1[2],xmm2[2],xmm1[3],xmm2[3]
115 ; SSE41-NEXT: psrld %xmm1, %xmm2
123 ; AVX1-NEXT: vpsrldq {{.*#+}} xmm2 = xmm1[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,z…
125 ; AVX1-NEXT: vpsrlq $32, %xmm1, %xmm3
129 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm3 = xmm1[2],xmm3[2],xmm1[3],xmm3[3]
131 ; AVX1-NEXT: vpmovzxdq {{.*#+}} xmm1 = xmm1[0],zero,xmm1[1],zero
132 ; AVX1-NEXT: vpsrld %xmm1, %xmm0, %xmm0
139 ; AVX2-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0
145 ; XOPAVX1-NEXT: vpsubd %xmm1, %xmm2, %xmm1
146 ; XOPAVX1-NEXT: vpshld %xmm1, %xmm0, %xmm0
151 ; XOPAVX2-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0
156 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
160 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
167 ; X32-SSE-NEXT: movdqa %xmm1, %xmm4
171 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1]
172 ; X32-SSE-NEXT: psrld %xmm1, %xmm0
184 ; SSE2-NEXT: psllw $12, %xmm1
185 ; SSE2-NEXT: movdqa %xmm1, %xmm2
192 ; SSE2-NEXT: paddw %xmm1, %xmm1
193 ; SSE2-NEXT: movdqa %xmm1, %xmm2
200 ; SSE2-NEXT: paddw %xmm1, %xmm1
201 ; SSE2-NEXT: movdqa %xmm1, %xmm2
208 ; SSE2-NEXT: paddw %xmm1, %xmm1
209 ; SSE2-NEXT: psraw $15, %xmm1
210 ; SSE2-NEXT: movdqa %xmm1, %xmm2
213 ; SSE2-NEXT: pand %xmm1, %xmm0
220 ; SSE41-NEXT: movdqa %xmm1, %xmm0
222 ; SSE41-NEXT: psllw $4, %xmm1
223 ; SSE41-NEXT: por %xmm0, %xmm1
224 ; SSE41-NEXT: movdqa %xmm1, %xmm3
228 ; SSE41-NEXT: movdqa %xmm1, %xmm0
230 ; SSE41-NEXT: movdqa %xmm2, %xmm1
231 ; SSE41-NEXT: psrlw $4, %xmm1
233 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
234 ; SSE41-NEXT: movdqa %xmm2, %xmm1
235 ; SSE41-NEXT: psrlw $2, %xmm1
238 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
239 ; SSE41-NEXT: movdqa %xmm2, %xmm1
240 ; SSE41-NEXT: psrlw $1, %xmm1
243 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
249 ; AVX1-NEXT: vpsllw $12, %xmm1, %xmm2
250 ; AVX1-NEXT: vpsllw $4, %xmm1, %xmm1
251 ; AVX1-NEXT: vpor %xmm2, %xmm1, %xmm1
252 ; AVX1-NEXT: vpaddw %xmm1, %xmm1, %xmm2
254 ; AVX1-NEXT: vpblendvb %xmm1, %xmm3, %xmm0, %xmm0
255 ; AVX1-NEXT: vpsrlw $4, %xmm0, %xmm1
256 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
257 ; AVX1-NEXT: vpsrlw $2, %xmm0, %xmm1
259 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
260 ; AVX1-NEXT: vpsrlw $1, %xmm0, %xmm1
262 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
267 … vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1
278 ; XOP-NEXT: vpsubw %xmm1, %xmm2, %xmm1
279 ; XOP-NEXT: vpshlw %xmm1, %xmm0, %xmm0
284 ; X32-SSE-NEXT: psllw $12, %xmm1
285 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
292 ; X32-SSE-NEXT: paddw %xmm1, %xmm1
293 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
300 ; X32-SSE-NEXT: paddw %xmm1, %xmm1
301 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
308 ; X32-SSE-NEXT: paddw %xmm1, %xmm1
309 ; X32-SSE-NEXT: psraw $15, %xmm1
310 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
313 ; X32-SSE-NEXT: pand %xmm1, %xmm0
323 ; SSE2-NEXT: psllw $5, %xmm1
326 ; SSE2-NEXT: pcmpgtb %xmm1, %xmm3
333 ; SSE2-NEXT: paddb %xmm1, %xmm1
335 ; SSE2-NEXT: pcmpgtb %xmm1, %xmm3
342 ; SSE2-NEXT: paddb %xmm1, %xmm1
343 ; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
344 ; SSE2-NEXT: movdqa %xmm2, %xmm1
345 ; SSE2-NEXT: pandn %xmm0, %xmm1
349 ; SSE2-NEXT: por %xmm1, %xmm0
355 ; SSE41-NEXT: psllw $5, %xmm1
359 ; SSE41-NEXT: movdqa %xmm1, %xmm0
364 ; SSE41-NEXT: paddb %xmm1, %xmm1
365 ; SSE41-NEXT: movdqa %xmm1, %xmm0
370 ; SSE41-NEXT: paddb %xmm1, %xmm1
371 ; SSE41-NEXT: movdqa %xmm1, %xmm0
378 ; AVX-NEXT: vpsllw $5, %xmm1, %xmm1
381 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
384 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
385 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
388 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
389 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
395 ; XOP-NEXT: vpsubb %xmm1, %xmm2, %xmm1
396 ; XOP-NEXT: vpshlb %xmm1, %xmm0, %xmm0
401 ; X32-SSE-NEXT: psllw $5, %xmm1
404 ; X32-SSE-NEXT: pcmpgtb %xmm1, %xmm3
411 ; X32-SSE-NEXT: paddb %xmm1, %xmm1
413 ; X32-SSE-NEXT: pcmpgtb %xmm1, %xmm3
420 ; X32-SSE-NEXT: paddb %xmm1, %xmm1
421 ; X32-SSE-NEXT: pcmpgtb %xmm1, %xmm2
422 ; X32-SSE-NEXT: movdqa %xmm2, %xmm1
423 ; X32-SSE-NEXT: pandn %xmm0, %xmm1
427 ; X32-SSE-NEXT: por %xmm1, %xmm0
440 ; SSE-NEXT: psrlq %xmm1, %xmm0
445 ; AVX-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
450 ; XOP-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
455 ; X32-SSE-NEXT: movq {{.*#+}} xmm1 = xmm1[0],zero
456 ; X32-SSE-NEXT: psrlq %xmm1, %xmm0
467 ; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
474 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1],xmm2[2,3,4,5,6,7]
481 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
482 ; AVX-NEXT: vpsrld %xmm1, %xmm0, %xmm0
488 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
489 ; XOP-NEXT: vpsrld %xmm1, %xmm0, %xmm0
495 ; X32-SSE-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
506 ; SSE2-NEXT: movd %xmm1, %eax
508 ; SSE2-NEXT: movd %eax, %xmm1
509 ; SSE2-NEXT: psrlw %xmm1, %xmm0
515 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
522 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
523 ; AVX-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
529 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
530 ; XOP-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
535 ; X32-SSE-NEXT: movd %xmm1, %eax
537 ; X32-SSE-NEXT: movd %eax, %xmm1
538 ; X32-SSE-NEXT: psrlw %xmm1, %xmm0
548 ; SSE2-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
549 ; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,0,3]
550 ; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,0,0,0,4,5,6,7]
551 ; SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm1[0,1,2,3,4,4,4,4]
553 ; SSE2-NEXT: pxor %xmm1, %xmm1
572 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
573 ; SSE2-NEXT: movdqa %xmm1, %xmm2
577 ; SSE2-NEXT: pand %xmm1, %xmm0
585 ; SSE41-NEXT: pshufb %xmm0, %xmm1
586 ; SSE41-NEXT: psllw $5, %xmm1
587 ; SSE41-NEXT: movdqa %xmm1, %xmm3
592 ; SSE41-NEXT: movdqa %xmm1, %xmm0
594 ; SSE41-NEXT: movdqa %xmm2, %xmm1
595 ; SSE41-NEXT: psrlw $2, %xmm1
596 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm1
598 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
599 ; SSE41-NEXT: movdqa %xmm2, %xmm1
600 ; SSE41-NEXT: psrlw $1, %xmm1
601 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm1
604 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
611 ; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
612 ; AVX1-NEXT: vpsllw $5, %xmm1, %xmm1
613 ; AVX1-NEXT: vpaddb %xmm1, %xmm1, %xmm2
616 ; AVX1-NEXT: vpblendvb %xmm1, %xmm3, %xmm0, %xmm0
617 ; AVX1-NEXT: vpsrlw $2, %xmm0, %xmm1
618 ; AVX1-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1
619 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
620 ; AVX1-NEXT: vpsrlw $1, %xmm0, %xmm1
621 ; AVX1-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1
623 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
628 ; AVX2-NEXT: vpbroadcastb %xmm1, %xmm1
629 ; AVX2-NEXT: vpsllw $5, %xmm1, %xmm1
632 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
635 ; AVX2-NEXT: vpaddb %xmm1, %xmm1, %xmm1
636 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
639 ; AVX2-NEXT: vpaddb %xmm1, %xmm1, %xmm1
640 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
646 ; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
647 ; XOPAVX1-NEXT: vpsubb %xmm1, %xmm2, %xmm1
648 ; XOPAVX1-NEXT: vpshlb %xmm1, %xmm0, %xmm0
653 ; XOPAVX2-NEXT: vpbroadcastb %xmm1, %xmm1
655 ; XOPAVX2-NEXT: vpsubb %xmm1, %xmm2, %xmm1
656 ; XOPAVX2-NEXT: vpshlb %xmm1, %xmm0, %xmm0
661 ; X32-SSE-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
662 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,0,3]
663 ; X32-SSE-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,0,0,0,4,5,6,7]
664 ; X32-SSE-NEXT: pshufhw {{.*#+}} xmm2 = xmm1[0,1,2,3,4,4,4,4]
666 ; X32-SSE-NEXT: pxor %xmm1, %xmm1
685 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm1
686 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
690 ; X32-SSE-NEXT: pand %xmm1, %xmm0
705 ; SSE2-NEXT: movdqa %xmm0, %xmm1
706 ; SSE2-NEXT: psrlq $7, %xmm1
708 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
709 ; SSE2-NEXT: movapd %xmm1, %xmm0
714 ; SSE41-NEXT: movdqa %xmm0, %xmm1
715 ; SSE41-NEXT: psrlq $7, %xmm1
717 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
722 ; AVX1-NEXT: vpsrlq $7, %xmm0, %xmm1
724 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
734 ; XOPAVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
735 ; XOPAVX1-NEXT: vpsubq {{.*}}(%rip), %xmm1, %xmm1
736 ; XOPAVX1-NEXT: vpshlq %xmm1, %xmm0, %xmm0
746 ; X32-SSE-NEXT: movdqa %xmm0, %xmm1
747 ; X32-SSE-NEXT: psrlq $7, %xmm1
749 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
750 ; X32-SSE-NEXT: movapd %xmm1, %xmm0
759 ; SSE2-NEXT: movdqa %xmm0, %xmm1
760 ; SSE2-NEXT: psrld $7, %xmm1
763 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]
764 ; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
770 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
775 ; SSE41-NEXT: movdqa %xmm0, %xmm1
776 ; SSE41-NEXT: psrld $7, %xmm1
779 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm1[4,5,6,7]
780 ; SSE41-NEXT: movdqa %xmm0, %xmm1
781 ; SSE41-NEXT: psrld $6, %xmm1
783 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
789 ; AVX1-NEXT: vpsrld $7, %xmm0, %xmm1
791 ; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm2[0,1,2,3],xmm1[4,5,6,7]
795 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]
815 ; X32-SSE-NEXT: movdqa %xmm0, %xmm1
816 ; X32-SSE-NEXT: psrld $7, %xmm1
819 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]
820 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,3,2,3]
826 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
835 ; SSE2-NEXT: movdqa %xmm0, %xmm1
836 ; SSE2-NEXT: psrlw $4, %xmm1
837 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
838 ; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,2,2,3]
839 ; SSE2-NEXT: psrlw $2, %xmm1
840 ; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
843 ; SSE2-NEXT: movdqa %xmm2, %xmm1
844 ; SSE2-NEXT: pand %xmm0, %xmm1
847 ; SSE2-NEXT: por %xmm1, %xmm0
852 ; SSE41-NEXT: movdqa %xmm0, %xmm1
853 ; SSE41-NEXT: movdqa %xmm1, %xmm2
856 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
857 ; SSE41-NEXT: movdqa %xmm1, %xmm2
860 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
861 ; SSE41-NEXT: movdqa %xmm1, %xmm2
864 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
865 ; SSE41-NEXT: movdqa %xmm1, %xmm2
868 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
869 ; SSE41-NEXT: movdqa %xmm1, %xmm0
874 ; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm1
876 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
877 ; AVX1-NEXT: vpsrlw $4, %xmm0, %xmm1
879 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
880 ; AVX1-NEXT: vpsrlw $2, %xmm0, %xmm1
882 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
883 ; AVX1-NEXT: vpsrlw $1, %xmm0, %xmm1
885 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
900 ; XOP-NEXT: vpxor %xmm1, %xmm1, %xmm1
901 ; XOP-NEXT: vpsubw {{.*}}(%rip), %xmm1, %xmm1
902 ; XOP-NEXT: vpshlw %xmm1, %xmm0, %xmm0
907 ; X32-SSE-NEXT: movdqa %xmm0, %xmm1
908 ; X32-SSE-NEXT: psrlw $4, %xmm1
909 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
910 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,2,2,3]
911 ; X32-SSE-NEXT: psrlw $2, %xmm1
912 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
915 ; X32-SSE-NEXT: movdqa %xmm2, %xmm1
916 ; X32-SSE-NEXT: pand %xmm0, %xmm1
919 ; X32-SSE-NEXT: por %xmm1, %xmm0
930 ; SSE2-NEXT: pxor %xmm1, %xmm1
949 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
950 ; SSE2-NEXT: movdqa %xmm1, %xmm2
954 ; SSE2-NEXT: pand %xmm1, %xmm0
960 ; SSE41-NEXT: movdqa %xmm0, %xmm1
963 ; SSE41-NEXT: movdqa %xmm1, %xmm2
966 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
967 ; SSE41-NEXT: movdqa %xmm1, %xmm2
971 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
972 ; SSE41-NEXT: movdqa %xmm1, %xmm2
976 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
977 ; SSE41-NEXT: movdqa %xmm1, %xmm0
982 ; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [0,1,2,3,4,5,6,7,7,6,5,4,3,2,1,0]
983 ; AVX-NEXT: vpsllw $5, %xmm1, %xmm1
986 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
989 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
990 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
993 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
994 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
999 ; XOP-NEXT: vpxor %xmm1, %xmm1, %xmm1
1000 ; XOP-NEXT: vpsubb {{.*}}(%rip), %xmm1, %xmm1
1001 ; XOP-NEXT: vpshlb %xmm1, %xmm0, %xmm0
1008 ; X32-SSE-NEXT: pxor %xmm1, %xmm1
1027 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm1
1028 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
1032 ; X32-SSE-NEXT: pand %xmm1, %xmm0
1130 ; XOP-NEXT: vpxor %xmm1, %xmm1, %xmm1
1131 ; XOP-NEXT: vpsubb {{.*}}(%rip), %xmm1, %xmm1
1132 ; XOP-NEXT: vpshlb %xmm1, %xmm0, %xmm0