Lines Matching refs:xmm1
19 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm1[2,3,0,1]
22 ; SSE2-NEXT: psllq %xmm1, %xmm0
30 ; SSE41-NEXT: psllq %xmm1, %xmm2
31 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[2,3,0,1]
32 ; SSE41-NEXT: psllq %xmm1, %xmm0
38 ; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm2
39 ; AVX1-NEXT: vpshufd {{.*#+}} xmm1 = xmm1[2,3,0,1]
40 ; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm0
46 ; AVX2-NEXT: vpsllvq %xmm1, %xmm0, %xmm0
51 ; XOPAVX1-NEXT: vpshlq %xmm1, %xmm0, %xmm0
56 ; XOPAVX2-NEXT: vpsllvq %xmm1, %xmm0, %xmm0
61 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm1[2,3,0,1]
64 ; X32-SSE-NEXT: movq {{.*#+}} xmm1 = xmm1[0],zero
65 ; X32-SSE-NEXT: psllq %xmm1, %xmm0
76 ; SSE2-NEXT: pslld $23, %xmm1
77 ; SSE2-NEXT: paddd {{.*}}(%rip), %xmm1
78 ; SSE2-NEXT: cvttps2dq %xmm1, %xmm1
79 ; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
80 ; SSE2-NEXT: pmuludq %xmm0, %xmm1
81 ; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
85 ; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
86 ; SSE2-NEXT: movdqa %xmm1, %xmm0
91 ; SSE41-NEXT: pslld $23, %xmm1
92 ; SSE41-NEXT: paddd {{.*}}(%rip), %xmm1
93 ; SSE41-NEXT: cvttps2dq %xmm1, %xmm1
94 ; SSE41-NEXT: pmulld %xmm1, %xmm0
99 ; AVX1-NEXT: vpslld $23, %xmm1, %xmm1
100 ; AVX1-NEXT: vpaddd {{.*}}(%rip), %xmm1, %xmm1
101 ; AVX1-NEXT: vcvttps2dq %xmm1, %xmm1
102 ; AVX1-NEXT: vpmulld %xmm0, %xmm1, %xmm0
107 ; AVX2-NEXT: vpsllvd %xmm1, %xmm0, %xmm0
112 ; XOPAVX1-NEXT: vpshld %xmm1, %xmm0, %xmm0
117 ; XOPAVX2-NEXT: vpsllvd %xmm1, %xmm0, %xmm0
122 ; X32-SSE-NEXT: pslld $23, %xmm1
123 ; X32-SSE-NEXT: paddd .LCPI1_0, %xmm1
124 ; X32-SSE-NEXT: cvttps2dq %xmm1, %xmm1
125 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
126 ; X32-SSE-NEXT: pmuludq %xmm0, %xmm1
127 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
131 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
132 ; X32-SSE-NEXT: movdqa %xmm1, %xmm0
141 ; SSE2-NEXT: psllw $12, %xmm1
142 ; SSE2-NEXT: movdqa %xmm1, %xmm2
149 ; SSE2-NEXT: paddw %xmm1, %xmm1
150 ; SSE2-NEXT: movdqa %xmm1, %xmm2
157 ; SSE2-NEXT: paddw %xmm1, %xmm1
158 ; SSE2-NEXT: movdqa %xmm1, %xmm2
165 ; SSE2-NEXT: paddw %xmm1, %xmm1
166 ; SSE2-NEXT: psraw $15, %xmm1
167 ; SSE2-NEXT: movdqa %xmm1, %xmm2
170 ; SSE2-NEXT: pand %xmm1, %xmm0
177 ; SSE41-NEXT: movdqa %xmm1, %xmm0
179 ; SSE41-NEXT: psllw $4, %xmm1
180 ; SSE41-NEXT: por %xmm0, %xmm1
181 ; SSE41-NEXT: movdqa %xmm1, %xmm3
185 ; SSE41-NEXT: movdqa %xmm1, %xmm0
187 ; SSE41-NEXT: movdqa %xmm2, %xmm1
188 ; SSE41-NEXT: psllw $4, %xmm1
190 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
191 ; SSE41-NEXT: movdqa %xmm2, %xmm1
192 ; SSE41-NEXT: psllw $2, %xmm1
195 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
196 ; SSE41-NEXT: movdqa %xmm2, %xmm1
197 ; SSE41-NEXT: psllw $1, %xmm1
200 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
206 ; AVX1-NEXT: vpsllw $12, %xmm1, %xmm2
207 ; AVX1-NEXT: vpsllw $4, %xmm1, %xmm1
208 ; AVX1-NEXT: vpor %xmm2, %xmm1, %xmm1
209 ; AVX1-NEXT: vpaddw %xmm1, %xmm1, %xmm2
211 ; AVX1-NEXT: vpblendvb %xmm1, %xmm3, %xmm0, %xmm0
212 ; AVX1-NEXT: vpsllw $4, %xmm0, %xmm1
213 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
214 ; AVX1-NEXT: vpsllw $2, %xmm0, %xmm1
216 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
217 ; AVX1-NEXT: vpsllw $1, %xmm0, %xmm1
219 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
224 … vpmovzxwd {{.*#+}} ymm1 = xmm1[0],zero,xmm1[1],zero,xmm1[2],zero,xmm1[3],zero,xmm1[4],zero,xmm1…
234 ; XOP-NEXT: vpshlw %xmm1, %xmm0, %xmm0
239 ; X32-SSE-NEXT: psllw $12, %xmm1
240 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
247 ; X32-SSE-NEXT: paddw %xmm1, %xmm1
248 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
255 ; X32-SSE-NEXT: paddw %xmm1, %xmm1
256 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
263 ; X32-SSE-NEXT: paddw %xmm1, %xmm1
264 ; X32-SSE-NEXT: psraw $15, %xmm1
265 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
268 ; X32-SSE-NEXT: pand %xmm1, %xmm0
278 ; SSE2-NEXT: psllw $5, %xmm1
281 ; SSE2-NEXT: pcmpgtb %xmm1, %xmm3
288 ; SSE2-NEXT: paddb %xmm1, %xmm1
290 ; SSE2-NEXT: pcmpgtb %xmm1, %xmm3
297 ; SSE2-NEXT: paddb %xmm1, %xmm1
298 ; SSE2-NEXT: pcmpgtb %xmm1, %xmm2
299 ; SSE2-NEXT: movdqa %xmm2, %xmm1
300 ; SSE2-NEXT: pandn %xmm0, %xmm1
303 ; SSE2-NEXT: por %xmm1, %xmm0
309 ; SSE41-NEXT: psllw $5, %xmm1
313 ; SSE41-NEXT: movdqa %xmm1, %xmm0
318 ; SSE41-NEXT: paddb %xmm1, %xmm1
319 ; SSE41-NEXT: movdqa %xmm1, %xmm0
323 ; SSE41-NEXT: paddb %xmm1, %xmm1
324 ; SSE41-NEXT: movdqa %xmm1, %xmm0
331 ; AVX-NEXT: vpsllw $5, %xmm1, %xmm1
334 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
337 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
338 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
340 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
341 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
346 ; XOP-NEXT: vpshlb %xmm1, %xmm0, %xmm0
351 ; X32-SSE-NEXT: psllw $5, %xmm1
354 ; X32-SSE-NEXT: pcmpgtb %xmm1, %xmm3
361 ; X32-SSE-NEXT: paddb %xmm1, %xmm1
363 ; X32-SSE-NEXT: pcmpgtb %xmm1, %xmm3
370 ; X32-SSE-NEXT: paddb %xmm1, %xmm1
371 ; X32-SSE-NEXT: pcmpgtb %xmm1, %xmm2
372 ; X32-SSE-NEXT: movdqa %xmm2, %xmm1
373 ; X32-SSE-NEXT: pandn %xmm0, %xmm1
376 ; X32-SSE-NEXT: por %xmm1, %xmm0
389 ; SSE-NEXT: psllq %xmm1, %xmm0
394 ; AVX-NEXT: vpsllq %xmm1, %xmm0, %xmm0
399 ; XOP-NEXT: vpsllq %xmm1, %xmm0, %xmm0
404 ; X32-SSE-NEXT: movq {{.*#+}} xmm1 = xmm1[0],zero
405 ; X32-SSE-NEXT: psllq %xmm1, %xmm0
416 ; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
423 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1],xmm2[2,3,4,5,6,7]
430 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
431 ; AVX-NEXT: vpslld %xmm1, %xmm0, %xmm0
437 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
438 ; XOP-NEXT: vpslld %xmm1, %xmm0, %xmm0
444 ; X32-SSE-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
455 ; SSE2-NEXT: movd %xmm1, %eax
457 ; SSE2-NEXT: movd %eax, %xmm1
458 ; SSE2-NEXT: psllw %xmm1, %xmm0
464 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
471 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
472 ; AVX-NEXT: vpsllw %xmm1, %xmm0, %xmm0
478 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
479 ; XOP-NEXT: vpsllw %xmm1, %xmm0, %xmm0
484 ; X32-SSE-NEXT: movd %xmm1, %eax
486 ; X32-SSE-NEXT: movd %eax, %xmm1
487 ; X32-SSE-NEXT: psllw %xmm1, %xmm0
497 ; SSE2-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
498 ; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,0,3]
499 ; SSE2-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,0,0,0,4,5,6,7]
500 ; SSE2-NEXT: pshufhw {{.*#+}} xmm2 = xmm1[0,1,2,3,4,4,4,4]
502 ; SSE2-NEXT: pxor %xmm1, %xmm1
521 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
522 ; SSE2-NEXT: movdqa %xmm1, %xmm2
525 ; SSE2-NEXT: pand %xmm1, %xmm0
533 ; SSE41-NEXT: pshufb %xmm0, %xmm1
534 ; SSE41-NEXT: psllw $5, %xmm1
535 ; SSE41-NEXT: movdqa %xmm1, %xmm3
540 ; SSE41-NEXT: movdqa %xmm1, %xmm0
542 ; SSE41-NEXT: movdqa %xmm2, %xmm1
543 ; SSE41-NEXT: psllw $2, %xmm1
544 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm1
546 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
547 ; SSE41-NEXT: movdqa %xmm2, %xmm1
548 ; SSE41-NEXT: paddb %xmm1, %xmm1
551 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
558 ; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
559 ; AVX1-NEXT: vpsllw $5, %xmm1, %xmm1
560 ; AVX1-NEXT: vpaddb %xmm1, %xmm1, %xmm2
563 ; AVX1-NEXT: vpblendvb %xmm1, %xmm3, %xmm0, %xmm0
564 ; AVX1-NEXT: vpsllw $2, %xmm0, %xmm1
565 ; AVX1-NEXT: vpand {{.*}}(%rip), %xmm1, %xmm1
566 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
567 ; AVX1-NEXT: vpaddb %xmm0, %xmm0, %xmm1
569 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
574 ; AVX2-NEXT: vpbroadcastb %xmm1, %xmm1
575 ; AVX2-NEXT: vpsllw $5, %xmm1, %xmm1
578 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
581 ; AVX2-NEXT: vpaddb %xmm1, %xmm1, %xmm1
582 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
584 ; AVX2-NEXT: vpaddb %xmm1, %xmm1, %xmm1
585 ; AVX2-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
591 ; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
592 ; XOPAVX1-NEXT: vpshlb %xmm1, %xmm0, %xmm0
597 ; XOPAVX2-NEXT: vpbroadcastb %xmm1, %xmm1
598 ; XOPAVX2-NEXT: vpshlb %xmm1, %xmm0, %xmm0
603 ; X32-SSE-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
604 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,0,3]
605 ; X32-SSE-NEXT: pshuflw {{.*#+}} xmm1 = xmm1[0,0,0,0,4,5,6,7]
606 ; X32-SSE-NEXT: pshufhw {{.*#+}} xmm2 = xmm1[0,1,2,3,4,4,4,4]
608 ; X32-SSE-NEXT: pxor %xmm1, %xmm1
627 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm1
628 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
631 ; X32-SSE-NEXT: pand %xmm1, %xmm0
646 ; SSE2-NEXT: movdqa %xmm0, %xmm1
647 ; SSE2-NEXT: psllq $7, %xmm1
649 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
650 ; SSE2-NEXT: movapd %xmm1, %xmm0
655 ; SSE41-NEXT: movdqa %xmm0, %xmm1
656 ; SSE41-NEXT: psllq $7, %xmm1
658 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
663 ; AVX1-NEXT: vpsllq $7, %xmm0, %xmm1
665 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5,6,7]
685 ; X32-SSE-NEXT: movdqa %xmm0, %xmm1
686 ; X32-SSE-NEXT: psllq $7, %xmm1
688 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
689 ; X32-SSE-NEXT: movapd %xmm1, %xmm0
698 ; SSE2-NEXT: movdqa {{.*#+}} xmm1 = [16,32,64,128]
700 ; SSE2-NEXT: pmuludq %xmm1, %xmm0
702 ; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
703 ; SSE2-NEXT: pmuludq %xmm2, %xmm1
704 ; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
705 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
735 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm1 = [16,32,64,128]
737 ; X32-SSE-NEXT: pmuludq %xmm1, %xmm0
739 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[1,1,3,3]
740 ; X32-SSE-NEXT: pmuludq %xmm2, %xmm1
741 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,2,2,3]
742 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
777 ; SSE2-NEXT: pxor %xmm1, %xmm1
796 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm1
797 ; SSE2-NEXT: movdqa %xmm1, %xmm2
800 ; SSE2-NEXT: pand %xmm1, %xmm0
806 ; SSE41-NEXT: movdqa %xmm0, %xmm1
809 ; SSE41-NEXT: movdqa %xmm1, %xmm2
812 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
813 ; SSE41-NEXT: movdqa %xmm1, %xmm2
817 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
818 ; SSE41-NEXT: movdqa %xmm1, %xmm2
821 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
822 ; SSE41-NEXT: movdqa %xmm1, %xmm0
827 ; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [0,1,2,3,4,5,6,7,7,6,5,4,3,2,1,0]
828 ; AVX-NEXT: vpsllw $5, %xmm1, %xmm1
831 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
834 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
835 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
837 ; AVX-NEXT: vpaddb %xmm1, %xmm1, %xmm1
838 ; AVX-NEXT: vpblendvb %xmm1, %xmm2, %xmm0, %xmm0
850 ; X32-SSE-NEXT: pxor %xmm1, %xmm1
869 ; X32-SSE-NEXT: pcmpgtb %xmm2, %xmm1
870 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
873 ; X32-SSE-NEXT: pand %xmm1, %xmm0