Lines Matching refs:xmm2
20 ; SSE2-NEXT: movdqa %xmm0, %xmm2
21 ; SSE2-NEXT: psllq %xmm3, %xmm2
23 ; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
24 ; SSE2-NEXT: movapd %xmm2, %xmm0
29 ; SSE41-NEXT: movdqa %xmm0, %xmm2
30 ; SSE41-NEXT: psllq %xmm1, %xmm2
33 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
38 ; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm2
41 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm2[0,1,2,3],xmm0[4,5,6,7]
62 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
63 ; X32-SSE-NEXT: psllq %xmm3, %xmm2
66 ; X32-SSE-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
67 ; X32-SSE-NEXT: movapd %xmm2, %xmm0
79 ; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
83 ; SSE2-NEXT: pmuludq %xmm2, %xmm0
125 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
129 ; X32-SSE-NEXT: pmuludq %xmm2, %xmm0
142 ; SSE2-NEXT: movdqa %xmm1, %xmm2
143 ; SSE2-NEXT: psraw $15, %xmm2
144 ; SSE2-NEXT: movdqa %xmm2, %xmm3
147 ; SSE2-NEXT: pand %xmm2, %xmm0
150 ; SSE2-NEXT: movdqa %xmm1, %xmm2
151 ; SSE2-NEXT: psraw $15, %xmm2
152 ; SSE2-NEXT: movdqa %xmm2, %xmm3
155 ; SSE2-NEXT: pand %xmm2, %xmm0
158 ; SSE2-NEXT: movdqa %xmm1, %xmm2
159 ; SSE2-NEXT: psraw $15, %xmm2
160 ; SSE2-NEXT: movdqa %xmm2, %xmm3
163 ; SSE2-NEXT: pand %xmm2, %xmm0
167 ; SSE2-NEXT: movdqa %xmm1, %xmm2
168 ; SSE2-NEXT: pandn %xmm0, %xmm2
171 ; SSE2-NEXT: por %xmm2, %xmm0
176 ; SSE41-NEXT: movdqa %xmm0, %xmm2
183 ; SSE41-NEXT: movdqa %xmm2, %xmm4
186 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
187 ; SSE41-NEXT: movdqa %xmm2, %xmm1
190 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
191 ; SSE41-NEXT: movdqa %xmm2, %xmm1
195 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
196 ; SSE41-NEXT: movdqa %xmm2, %xmm1
200 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
201 ; SSE41-NEXT: movdqa %xmm2, %xmm0
206 ; AVX1-NEXT: vpsllw $12, %xmm1, %xmm2
208 ; AVX1-NEXT: vpor %xmm2, %xmm1, %xmm1
209 ; AVX1-NEXT: vpaddw %xmm1, %xmm1, %xmm2
213 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
215 ; AVX1-NEXT: vpaddw %xmm2, %xmm2, %xmm2
216 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
218 ; AVX1-NEXT: vpaddw %xmm2, %xmm2, %xmm2
219 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
240 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
241 ; X32-SSE-NEXT: psraw $15, %xmm2
242 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
245 ; X32-SSE-NEXT: pand %xmm2, %xmm0
248 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
249 ; X32-SSE-NEXT: psraw $15, %xmm2
250 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
253 ; X32-SSE-NEXT: pand %xmm2, %xmm0
256 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
257 ; X32-SSE-NEXT: psraw $15, %xmm2
258 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
261 ; X32-SSE-NEXT: pand %xmm2, %xmm0
265 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
266 ; X32-SSE-NEXT: pandn %xmm0, %xmm2
269 ; X32-SSE-NEXT: por %xmm2, %xmm0
279 ; SSE2-NEXT: pxor %xmm2, %xmm2
298 ; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
299 ; SSE2-NEXT: movdqa %xmm2, %xmm1
302 ; SSE2-NEXT: pand %xmm2, %xmm0
308 ; SSE41-NEXT: movdqa %xmm0, %xmm2
310 ; SSE41-NEXT: movdqa %xmm2, %xmm3
314 ; SSE41-NEXT: pblendvb %xmm3, %xmm2
315 ; SSE41-NEXT: movdqa %xmm2, %xmm3
320 ; SSE41-NEXT: pblendvb %xmm3, %xmm2
321 ; SSE41-NEXT: movdqa %xmm2, %xmm3
325 ; SSE41-NEXT: pblendvb %xmm3, %xmm2
326 ; SSE41-NEXT: movdqa %xmm2, %xmm0
332 ; AVX-NEXT: vpsllw $4, %xmm0, %xmm2
333 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm2, %xmm2
334 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
335 ; AVX-NEXT: vpsllw $2, %xmm0, %xmm2
336 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm2, %xmm2
338 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
339 ; AVX-NEXT: vpaddb %xmm0, %xmm0, %xmm2
341 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
352 ; X32-SSE-NEXT: pxor %xmm2, %xmm2
371 ; X32-SSE-NEXT: pcmpgtb %xmm1, %xmm2
372 ; X32-SSE-NEXT: movdqa %xmm2, %xmm1
375 ; X32-SSE-NEXT: pand %xmm2, %xmm0
415 ; SSE2-NEXT: xorps %xmm2, %xmm2
416 ; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
417 ; SSE2-NEXT: pslld %xmm2, %xmm0
422 ; SSE41-NEXT: pxor %xmm2, %xmm2
423 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1],xmm2[2,3,4,5,6,7]
424 ; SSE41-NEXT: pslld %xmm2, %xmm0
429 ; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
430 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
436 ; XOP-NEXT: vpxor %xmm2, %xmm2, %xmm2
437 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
443 ; X32-SSE-NEXT: xorps %xmm2, %xmm2
444 ; X32-SSE-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
445 ; X32-SSE-NEXT: pslld %xmm2, %xmm0
463 ; SSE41-NEXT: pxor %xmm2, %xmm2
464 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
465 ; SSE41-NEXT: psllw %xmm2, %xmm0
470 ; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
471 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
477 ; XOP-NEXT: vpxor %xmm2, %xmm2, %xmm2
478 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
500 ; SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm1[0,1,2,3,4,4,4,4]
501 ; SSE2-NEXT: psllw $5, %xmm2
504 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm3
511 ; SSE2-NEXT: paddb %xmm2, %xmm2
513 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm3
520 ; SSE2-NEXT: paddb %xmm2, %xmm2
521 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
522 ; SSE2-NEXT: movdqa %xmm1, %xmm2
523 ; SSE2-NEXT: pandn %xmm0, %xmm2
526 ; SSE2-NEXT: por %xmm2, %xmm0
531 ; SSE41-NEXT: movdqa %xmm0, %xmm2
537 ; SSE41-NEXT: movdqa %xmm2, %xmm4
541 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
542 ; SSE41-NEXT: movdqa %xmm2, %xmm1
546 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
547 ; SSE41-NEXT: movdqa %xmm2, %xmm1
551 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
552 ; SSE41-NEXT: movdqa %xmm2, %xmm0
557 ; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
558 ; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
560 ; AVX1-NEXT: vpaddb %xmm1, %xmm1, %xmm2
566 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
568 ; AVX1-NEXT: vpaddb %xmm2, %xmm2, %xmm2
569 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
576 ; AVX2-NEXT: vpsllw $4, %xmm0, %xmm2
577 ; AVX2-NEXT: vpand {{.*}}(%rip), %xmm2, %xmm2
578 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
579 ; AVX2-NEXT: vpsllw $2, %xmm0, %xmm2
580 ; AVX2-NEXT: vpand {{.*}}(%rip), %xmm2, %xmm2
582 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
583 ; AVX2-NEXT: vpaddb %xmm0, %xmm0, %xmm2
585 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
590 ; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
591 ; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
606 ; X32-SSE-NEXT: pshufhw {{.*#+}} xmm2 = xmm1[0,1,2,3,4,4,4,4]
607 ; X32-SSE-NEXT: psllw $5, %xmm2
610 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm3
617 ; X32-SSE-NEXT: paddb %xmm2, %xmm2
619 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm3
626 ; X32-SSE-NEXT: paddb %xmm2, %xmm2
627 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm1
628 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
629 ; X32-SSE-NEXT: pandn %xmm0, %xmm2
632 ; X32-SSE-NEXT: por %xmm2, %xmm0
699 ; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
703 ; SSE2-NEXT: pmuludq %xmm2, %xmm1
736 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
740 ; X32-SSE-NEXT: pmuludq %xmm2, %xmm1
775 ; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [0,1,2,3,4,5,6,7,7,6,5,4,3,2,1,0]
776 ; SSE2-NEXT: psllw $5, %xmm2
779 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm3
786 ; SSE2-NEXT: paddb %xmm2, %xmm2
788 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm3
795 ; SSE2-NEXT: paddb %xmm2, %xmm2
796 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
797 ; SSE2-NEXT: movdqa %xmm1, %xmm2
798 ; SSE2-NEXT: pandn %xmm0, %xmm2
801 ; SSE2-NEXT: por %xmm2, %xmm0
809 ; SSE41-NEXT: movdqa %xmm1, %xmm2
810 ; SSE41-NEXT: psllw $4, %xmm2
811 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm2
812 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
813 ; SSE41-NEXT: movdqa %xmm1, %xmm2
814 ; SSE41-NEXT: psllw $2, %xmm2
815 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm2
817 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
818 ; SSE41-NEXT: movdqa %xmm1, %xmm2
819 ; SSE41-NEXT: paddb %xmm2, %xmm2
821 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
829 ; AVX-NEXT: vpsllw $4, %xmm0, %xmm2
830 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm2, %xmm2
831 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
832 ; AVX-NEXT: vpsllw $2, %xmm0, %xmm2
833 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm2, %xmm2
835 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
836 ; AVX-NEXT: vpaddb %xmm0, %xmm0, %xmm2
838 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
848 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm2 = [0,1,2,3,4,5,6,7,7,6,5,4,3,2,1,0]
849 ; X32-SSE-NEXT: psllw $5, %xmm2
852 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm3
859 ; X32-SSE-NEXT: paddb %xmm2, %xmm2
861 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm3
868 ; X32-SSE-NEXT: paddb %xmm2, %xmm2
869 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm1
870 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
871 ; X32-SSE-NEXT: pandn %xmm0, %xmm2
874 ; X32-SSE-NEXT: por %xmm2, %xmm0