• Home
  • Raw
  • Download

Lines Matching refs:xmm0

21 ; SSE2-NEXT:    movdqa %xmm0, %xmm2
23 ; SSE2-NEXT: psrlq %xmm1, %xmm0
24 ; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
25 ; SSE2-NEXT: movapd %xmm2, %xmm0
30 ; SSE41-NEXT: movdqa %xmm0, %xmm2
33 ; SSE41-NEXT: psrlq %xmm1, %xmm0
34 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
39 ; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm2
41 ; AVX1-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
42 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
47 ; AVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0
54 ; XOPAVX1-NEXT: vpshlq %xmm1, %xmm0, %xmm0
59 ; XOPAVX2-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0
64 ; AVX512-NEXT: vpsrlvq %xmm1, %xmm0, %xmm0
70 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
73 ; X32-SSE-NEXT: psrlq %xmm1, %xmm0
74 ; X32-SSE-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
75 ; X32-SSE-NEXT: movapd %xmm2, %xmm0
86 ; SSE2-NEXT: movdqa %xmm0, %xmm3
90 ; SSE2-NEXT: movdqa %xmm0, %xmm4
97 ; SSE2-NEXT: movdqa %xmm0, %xmm5
100 ; SSE2-NEXT: psrld %xmm1, %xmm0
101 ; SSE2-NEXT: movsd {{.*#+}} xmm5 = xmm0[0],xmm5[1]
102 ; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,2,2,3]
103 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
110 ; SSE41-NEXT: movdqa %xmm0, %xmm3
114 ; SSE41-NEXT: movdqa %xmm0, %xmm4
120 ; SSE41-NEXT: movdqa %xmm0, %xmm2
122 ; SSE41-NEXT: psrld %xmm3, %xmm0
123 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]
124 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm4[2,3],xmm0[4,5],xmm4[6,7]
130 ; AVX1-NEXT: vpsrld %xmm2, %xmm0, %xmm2
132 ; AVX1-NEXT: vpsrld %xmm3, %xmm0, %xmm3
136 ; AVX1-NEXT: vpsrld %xmm3, %xmm0, %xmm3
138 ; AVX1-NEXT: vpsrld %xmm1, %xmm0, %xmm0
139 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm3[4,5,6,7]
140 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]
145 ; AVX2-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0
152 ; XOPAVX1-NEXT: vpshld %xmm1, %xmm0, %xmm0
157 ; XOPAVX2-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0
162 ; AVX512-NEXT: vpsrlvd %xmm1, %xmm0, %xmm0
169 ; X32-SSE-NEXT: movdqa %xmm0, %xmm3
173 ; X32-SSE-NEXT: movdqa %xmm0, %xmm4
180 ; X32-SSE-NEXT: movdqa %xmm0, %xmm5
183 ; X32-SSE-NEXT: psrld %xmm1, %xmm0
184 ; X32-SSE-NEXT: movsd {{.*#+}} xmm5 = xmm0[0],xmm5[1]
185 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm5[0,2,2,3]
186 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
199 ; SSE2-NEXT: pandn %xmm0, %xmm3
200 ; SSE2-NEXT: psrlw $8, %xmm0
201 ; SSE2-NEXT: pand %xmm2, %xmm0
202 ; SSE2-NEXT: por %xmm3, %xmm0
207 ; SSE2-NEXT: pandn %xmm0, %xmm3
208 ; SSE2-NEXT: psrlw $4, %xmm0
209 ; SSE2-NEXT: pand %xmm2, %xmm0
210 ; SSE2-NEXT: por %xmm3, %xmm0
215 ; SSE2-NEXT: pandn %xmm0, %xmm3
216 ; SSE2-NEXT: psrlw $2, %xmm0
217 ; SSE2-NEXT: pand %xmm2, %xmm0
218 ; SSE2-NEXT: por %xmm3, %xmm0
222 ; SSE2-NEXT: pandn %xmm0, %xmm2
223 ; SSE2-NEXT: psrlw $1, %xmm0
224 ; SSE2-NEXT: pand %xmm1, %xmm0
225 ; SSE2-NEXT: por %xmm2, %xmm0
230 ; SSE41-NEXT: movdqa %xmm0, %xmm2
231 ; SSE41-NEXT: movdqa %xmm1, %xmm0
232 ; SSE41-NEXT: psllw $12, %xmm0
234 ; SSE41-NEXT: por %xmm0, %xmm1
239 ; SSE41-NEXT: movdqa %xmm1, %xmm0
243 ; SSE41-NEXT: movdqa %xmm3, %xmm0
248 ; SSE41-NEXT: movdqa %xmm3, %xmm0
253 ; SSE41-NEXT: movdqa %xmm3, %xmm0
255 ; SSE41-NEXT: movdqa %xmm2, %xmm0
264 ; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm3
265 ; AVX1-NEXT: vpblendvb %xmm1, %xmm3, %xmm0, %xmm0
266 ; AVX1-NEXT: vpsrlw $4, %xmm0, %xmm1
267 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
268 ; AVX1-NEXT: vpsrlw $2, %xmm0, %xmm1
270 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
271 ; AVX1-NEXT: vpsrlw $1, %xmm0, %xmm1
273 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
279 … vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0
291 ; XOP-NEXT: vpshlw %xmm1, %xmm0, %xmm0
308 ; X32-SSE-NEXT: pandn %xmm0, %xmm3
309 ; X32-SSE-NEXT: psrlw $8, %xmm0
310 ; X32-SSE-NEXT: pand %xmm2, %xmm0
311 ; X32-SSE-NEXT: por %xmm3, %xmm0
316 ; X32-SSE-NEXT: pandn %xmm0, %xmm3
317 ; X32-SSE-NEXT: psrlw $4, %xmm0
318 ; X32-SSE-NEXT: pand %xmm2, %xmm0
319 ; X32-SSE-NEXT: por %xmm3, %xmm0
324 ; X32-SSE-NEXT: pandn %xmm0, %xmm3
325 ; X32-SSE-NEXT: psrlw $2, %xmm0
326 ; X32-SSE-NEXT: pand %xmm2, %xmm0
327 ; X32-SSE-NEXT: por %xmm3, %xmm0
331 ; X32-SSE-NEXT: pandn %xmm0, %xmm2
332 ; X32-SSE-NEXT: psrlw $1, %xmm0
333 ; X32-SSE-NEXT: pand %xmm1, %xmm0
334 ; X32-SSE-NEXT: por %xmm2, %xmm0
348 ; SSE2-NEXT: pandn %xmm0, %xmm4
349 ; SSE2-NEXT: psrlw $4, %xmm0
350 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
351 ; SSE2-NEXT: pand %xmm3, %xmm0
352 ; SSE2-NEXT: por %xmm4, %xmm0
357 ; SSE2-NEXT: pandn %xmm0, %xmm4
358 ; SSE2-NEXT: psrlw $2, %xmm0
359 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
360 ; SSE2-NEXT: pand %xmm3, %xmm0
361 ; SSE2-NEXT: por %xmm4, %xmm0
365 ; SSE2-NEXT: pandn %xmm0, %xmm1
366 ; SSE2-NEXT: psrlw $1, %xmm0
367 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
368 ; SSE2-NEXT: pand %xmm2, %xmm0
369 ; SSE2-NEXT: por %xmm1, %xmm0
374 ; SSE41-NEXT: movdqa %xmm0, %xmm2
379 ; SSE41-NEXT: movdqa %xmm1, %xmm0
385 ; SSE41-NEXT: movdqa %xmm1, %xmm0
391 ; SSE41-NEXT: movdqa %xmm1, %xmm0
393 ; SSE41-NEXT: movdqa %xmm2, %xmm0
399 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm2
401 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
402 ; AVX-NEXT: vpsrlw $2, %xmm0, %xmm2
405 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
406 ; AVX-NEXT: vpsrlw $1, %xmm0, %xmm2
409 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
416 ; XOP-NEXT: vpshlb %xmm1, %xmm0, %xmm0
422 ; AVX512-NEXT: vpsrlw $4, %xmm0, %xmm2
424 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
425 ; AVX512-NEXT: vpsrlw $2, %xmm0, %xmm2
428 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
429 ; AVX512-NEXT: vpsrlw $1, %xmm0, %xmm2
432 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
442 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
443 ; X32-SSE-NEXT: psrlw $4, %xmm0
444 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
445 ; X32-SSE-NEXT: pand %xmm3, %xmm0
446 ; X32-SSE-NEXT: por %xmm4, %xmm0
451 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
452 ; X32-SSE-NEXT: psrlw $2, %xmm0
453 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
454 ; X32-SSE-NEXT: pand %xmm3, %xmm0
455 ; X32-SSE-NEXT: por %xmm4, %xmm0
459 ; X32-SSE-NEXT: pandn %xmm0, %xmm1
460 ; X32-SSE-NEXT: psrlw $1, %xmm0
461 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
462 ; X32-SSE-NEXT: pand %xmm2, %xmm0
463 ; X32-SSE-NEXT: por %xmm1, %xmm0
476 ; SSE-NEXT: psrlq %xmm1, %xmm0
481 ; AVX-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
486 ; XOP-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
491 ; AVX512-NEXT: vpsrlq %xmm1, %xmm0, %xmm0
497 ; X32-SSE-NEXT: psrlq %xmm1, %xmm0
509 ; SSE2-NEXT: psrld %xmm2, %xmm0
516 ; SSE41-NEXT: psrld %xmm2, %xmm0
523 ; AVX-NEXT: vpsrld %xmm1, %xmm0, %xmm0
530 ; XOP-NEXT: vpsrld %xmm1, %xmm0, %xmm0
537 ; AVX512-NEXT: vpsrld %xmm1, %xmm0, %xmm0
544 ; X32-SSE-NEXT: psrld %xmm2, %xmm0
557 ; SSE2-NEXT: psrlw %xmm1, %xmm0
564 ; SSE41-NEXT: psrlw %xmm2, %xmm0
571 ; AVX-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
578 ; XOP-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
585 ; AVX512-NEXT: vpsrlw %xmm1, %xmm0, %xmm0
593 ; X32-SSE-NEXT: psrlw %xmm1, %xmm0
611 ; SSE2-NEXT: pandn %xmm0, %xmm4
612 ; SSE2-NEXT: psrlw $4, %xmm0
613 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
614 ; SSE2-NEXT: pand %xmm3, %xmm0
615 ; SSE2-NEXT: por %xmm4, %xmm0
620 ; SSE2-NEXT: pandn %xmm0, %xmm4
621 ; SSE2-NEXT: psrlw $2, %xmm0
622 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
623 ; SSE2-NEXT: pand %xmm3, %xmm0
624 ; SSE2-NEXT: por %xmm4, %xmm0
628 ; SSE2-NEXT: pandn %xmm0, %xmm2
629 ; SSE2-NEXT: psrlw $1, %xmm0
630 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
631 ; SSE2-NEXT: pand %xmm1, %xmm0
632 ; SSE2-NEXT: por %xmm2, %xmm0
637 ; SSE41-NEXT: movdqa %xmm0, %xmm2
638 ; SSE41-NEXT: pxor %xmm0, %xmm0
639 ; SSE41-NEXT: pshufb %xmm0, %xmm1
646 ; SSE41-NEXT: movdqa %xmm1, %xmm0
651 ; SSE41-NEXT: movdqa %xmm3, %xmm0
657 ; SSE41-NEXT: movdqa %xmm3, %xmm0
659 ; SSE41-NEXT: movdqa %xmm2, %xmm0
668 ; AVX1-NEXT: vpsrlw $4, %xmm0, %xmm3
670 ; AVX1-NEXT: vpblendvb %xmm1, %xmm3, %xmm0, %xmm0
671 ; AVX1-NEXT: vpsrlw $2, %xmm0, %xmm1
673 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
674 ; AVX1-NEXT: vpsrlw $1, %xmm0, %xmm1
677 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
684 ; AVX2-NEXT: vpsrlw $4, %xmm0, %xmm2
686 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
687 ; AVX2-NEXT: vpsrlw $2, %xmm0, %xmm2
690 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
691 ; AVX2-NEXT: vpsrlw $1, %xmm0, %xmm2
694 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
702 ; XOPAVX1-NEXT: vpshlb %xmm1, %xmm0, %xmm0
710 ; XOPAVX2-NEXT: vpshlb %xmm1, %xmm0, %xmm0
717 ; AVX512-NEXT: vpsrlw $4, %xmm0, %xmm2
719 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
720 ; AVX512-NEXT: vpsrlw $2, %xmm0, %xmm2
723 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
724 ; AVX512-NEXT: vpsrlw $1, %xmm0, %xmm2
727 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
740 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
741 ; X32-SSE-NEXT: psrlw $4, %xmm0
742 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
743 ; X32-SSE-NEXT: pand %xmm3, %xmm0
744 ; X32-SSE-NEXT: por %xmm4, %xmm0
749 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
750 ; X32-SSE-NEXT: psrlw $2, %xmm0
751 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
752 ; X32-SSE-NEXT: pand %xmm3, %xmm0
753 ; X32-SSE-NEXT: por %xmm4, %xmm0
757 ; X32-SSE-NEXT: pandn %xmm0, %xmm2
758 ; X32-SSE-NEXT: psrlw $1, %xmm0
759 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
760 ; X32-SSE-NEXT: pand %xmm1, %xmm0
761 ; X32-SSE-NEXT: por %xmm2, %xmm0
775 ; SSE2-NEXT: movdqa %xmm0, %xmm1
777 ; SSE2-NEXT: psrlq $1, %xmm0
778 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
779 ; SSE2-NEXT: movapd %xmm1, %xmm0
784 ; SSE41-NEXT: movdqa %xmm0, %xmm1
786 ; SSE41-NEXT: psrlq $1, %xmm0
787 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
792 ; AVX1-NEXT: vpsrlq $7, %xmm0, %xmm1
793 ; AVX1-NEXT: vpsrlq $1, %xmm0, %xmm0
794 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
799 ; AVX2-NEXT: vpsrlvq {{.*}}(%rip), %xmm0, %xmm0
806 ; XOPAVX1-NEXT: vpshlq %xmm1, %xmm0, %xmm0
811 ; XOPAVX2-NEXT: vpsrlvq {{.*}}(%rip), %xmm0, %xmm0
816 ; AVX512-NEXT: vpsrlvq {{.*}}(%rip), %xmm0, %xmm0
821 ; X32-SSE-NEXT: movdqa %xmm0, %xmm1
823 ; X32-SSE-NEXT: psrlq $1, %xmm0
824 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
825 ; X32-SSE-NEXT: movapd %xmm1, %xmm0
834 ; SSE2-NEXT: movdqa %xmm0, %xmm1
836 ; SSE2-NEXT: movdqa %xmm0, %xmm2
840 ; SSE2-NEXT: movdqa %xmm0, %xmm2
842 ; SSE2-NEXT: psrld $4, %xmm0
843 ; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
844 ; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
845 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
850 ; SSE41-NEXT: movdqa %xmm0, %xmm1
852 ; SSE41-NEXT: movdqa %xmm0, %xmm2
855 ; SSE41-NEXT: movdqa %xmm0, %xmm1
857 ; SSE41-NEXT: psrld $4, %xmm0
858 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
859 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]
864 ; AVX1-NEXT: vpsrld $7, %xmm0, %xmm1
865 ; AVX1-NEXT: vpsrld $5, %xmm0, %xmm2
867 ; AVX1-NEXT: vpsrld $6, %xmm0, %xmm2
868 ; AVX1-NEXT: vpsrld $4, %xmm0, %xmm0
869 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]
870 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]
875 ; AVX2-NEXT: vpsrlvd {{.*}}(%rip), %xmm0, %xmm0
880 ; XOPAVX1-NEXT: vpshld {{.*}}(%rip), %xmm0, %xmm0
885 ; XOPAVX2-NEXT: vpsrlvd {{.*}}(%rip), %xmm0, %xmm0
890 ; AVX512-NEXT: vpsrlvd {{.*}}(%rip), %xmm0, %xmm0
895 ; X32-SSE-NEXT: movdqa %xmm0, %xmm1
897 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
901 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
903 ; X32-SSE-NEXT: psrld $4, %xmm0
904 ; X32-SSE-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
905 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
906 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
915 ; SSE2-NEXT: movdqa %xmm0, %xmm1
917 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
920 ; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
921 ; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]
922 ; SSE2-NEXT: movdqa {{.*#+}} xmm0 = [65535,0,65535,0,65535,0,65535,0]
924 ; SSE2-NEXT: pand %xmm0, %xmm1
926 ; SSE2-NEXT: pandn %xmm2, %xmm0
927 ; SSE2-NEXT: por %xmm1, %xmm0
932 ; SSE41-NEXT: movdqa %xmm0, %xmm1
934 ; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1,2,3],xmm1[4,5,6,7]
938 ; SSE41-NEXT: movdqa %xmm2, %xmm0
939 ; SSE41-NEXT: psrlw $1, %xmm0
940 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0],xmm0[1],xmm2[2],xmm0[3],xmm2[4],xmm0[5],xmm2[6],xm…
945 ; AVX1-NEXT: vpsrlw $4, %xmm0, %xmm1
946 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
947 ; AVX1-NEXT: vpsrlw $2, %xmm0, %xmm1
948 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5],xmm1[6,7]
949 ; AVX1-NEXT: vpsrlw $1, %xmm0, %xmm1
950 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3],xmm0[4],xmm1[5],xmm0[6],xm…
955 … vpmovzxwd {{.*#+}} ymm0 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero,xmm0[4],zero,xmm0
967 ; XOP-NEXT: vpshlw %xmm1, %xmm0, %xmm0
980 ; X32-SSE-NEXT: movdqa %xmm0, %xmm1
982 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
985 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,3,2,3]
986 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]
987 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm0 = [65535,0,65535,0,65535,0,65535,0]
989 ; X32-SSE-NEXT: pand %xmm0, %xmm1
991 ; X32-SSE-NEXT: pandn %xmm2, %xmm0
992 ; X32-SSE-NEXT: por %xmm1, %xmm0
1007 ; SSE2-NEXT: pandn %xmm0, %xmm4
1008 ; SSE2-NEXT: psrlw $4, %xmm0
1009 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
1010 ; SSE2-NEXT: pand %xmm3, %xmm0
1011 ; SSE2-NEXT: por %xmm4, %xmm0
1016 ; SSE2-NEXT: pandn %xmm0, %xmm4
1017 ; SSE2-NEXT: psrlw $2, %xmm0
1018 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
1019 ; SSE2-NEXT: pand %xmm3, %xmm0
1020 ; SSE2-NEXT: por %xmm4, %xmm0
1024 ; SSE2-NEXT: pandn %xmm0, %xmm2
1025 ; SSE2-NEXT: psrlw $1, %xmm0
1026 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm0
1027 ; SSE2-NEXT: pand %xmm1, %xmm0
1028 ; SSE2-NEXT: por %xmm2, %xmm0
1033 ; SSE41-NEXT: movdqa %xmm0, %xmm1
1034 ; SSE41-NEXT: movdqa {{.*#+}} xmm0 = [0,1,2,3,4,5,6,7,7,6,5,4,3,2,1,0]
1035 ; SSE41-NEXT: psllw $5, %xmm0
1043 ; SSE41-NEXT: paddb %xmm0, %xmm0
1048 ; SSE41-NEXT: paddb %xmm0, %xmm0
1050 ; SSE41-NEXT: movdqa %xmm1, %xmm0
1057 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm2
1059 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
1060 ; AVX-NEXT: vpsrlw $2, %xmm0, %xmm2
1063 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
1064 ; AVX-NEXT: vpsrlw $1, %xmm0, %xmm2
1067 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
1074 ; XOP-NEXT: vpshlb %xmm1, %xmm0, %xmm0
1081 ; AVX512-NEXT: vpsrlw $4, %xmm0, %xmm2
1083 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
1084 ; AVX512-NEXT: vpsrlw $2, %xmm0, %xmm2
1087 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
1088 ; AVX512-NEXT: vpsrlw $1, %xmm0, %xmm2
1091 ; AVX512-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
1102 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
1103 ; X32-SSE-NEXT: psrlw $4, %xmm0
1104 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
1105 ; X32-SSE-NEXT: pand %xmm3, %xmm0
1106 ; X32-SSE-NEXT: por %xmm4, %xmm0
1111 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
1112 ; X32-SSE-NEXT: psrlw $2, %xmm0
1113 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
1114 ; X32-SSE-NEXT: pand %xmm3, %xmm0
1115 ; X32-SSE-NEXT: por %xmm4, %xmm0
1119 ; X32-SSE-NEXT: pandn %xmm0, %xmm2
1120 ; X32-SSE-NEXT: psrlw $1, %xmm0
1121 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0
1122 ; X32-SSE-NEXT: pand %xmm1, %xmm0
1123 ; X32-SSE-NEXT: por %xmm2, %xmm0
1136 ; SSE-NEXT: psrlq $7, %xmm0
1141 ; AVX-NEXT: vpsrlq $7, %xmm0, %xmm0
1146 ; XOP-NEXT: vpsrlq $7, %xmm0, %xmm0
1151 ; AVX512-NEXT: vpsrlq $7, %xmm0, %xmm0
1156 ; X32-SSE-NEXT: psrlq $7, %xmm0
1165 ; SSE-NEXT: psrld $5, %xmm0
1170 ; AVX-NEXT: vpsrld $5, %xmm0, %xmm0
1175 ; XOP-NEXT: vpsrld $5, %xmm0, %xmm0
1180 ; AVX512-NEXT: vpsrld $5, %xmm0, %xmm0
1185 ; X32-SSE-NEXT: psrld $5, %xmm0
1194 ; SSE-NEXT: psrlw $3, %xmm0
1199 ; AVX-NEXT: vpsrlw $3, %xmm0, %xmm0
1204 ; XOP-NEXT: vpsrlw $3, %xmm0, %xmm0
1209 ; AVX512-NEXT: vpsrlw $3, %xmm0, %xmm0
1214 ; X32-SSE-NEXT: psrlw $3, %xmm0
1223 ; SSE-NEXT: psrlw $3, %xmm0
1224 ; SSE-NEXT: pand {{.*}}(%rip), %xmm0
1229 ; AVX-NEXT: vpsrlw $3, %xmm0, %xmm0
1230 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0
1237 ; XOP-NEXT: vpshlb %xmm1, %xmm0, %xmm0
1242 ; AVX512-NEXT: vpsrlw $3, %xmm0, %xmm0
1243 ; AVX512-NEXT: vpand {{.*}}(%rip), %xmm0, %xmm0
1248 ; X32-SSE-NEXT: psrlw $3, %xmm0
1249 ; X32-SSE-NEXT: pand {{\.LCPI.*}}, %xmm0