Lines Matching refs:xmm2
20 ; SSE2-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
21 ; SSE2-NEXT: movdqa %xmm2, %xmm4
23 ; SSE2-NEXT: psrlq %xmm1, %xmm2
24 ; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm2[0],xmm4[1]
25 ; SSE2-NEXT: movdqa %xmm0, %xmm2
26 ; SSE2-NEXT: psrlq %xmm3, %xmm2
28 ; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
29 ; SSE2-NEXT: xorpd %xmm4, %xmm2
30 ; SSE2-NEXT: psubq %xmm4, %xmm2
31 ; SSE2-NEXT: movdqa %xmm2, %xmm0
36 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
37 ; SSE41-NEXT: movdqa %xmm2, %xmm3
40 ; SSE41-NEXT: psrlq %xmm4, %xmm2
41 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
46 ; SSE41-NEXT: pxor %xmm2, %xmm0
47 ; SSE41-NEXT: psubq %xmm2, %xmm0
52 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
53 ; AVX1-NEXT: vpsrlq %xmm1, %xmm2, %xmm3
55 ; AVX1-NEXT: vpsrlq %xmm4, %xmm2, %xmm2
56 ; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
60 ; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm0
61 ; AVX1-NEXT: vpsubq %xmm2, %xmm0, %xmm0
66 ; AVX2-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
67 ; AVX2-NEXT: vpsrlvq %xmm1, %xmm2, %xmm3
68 ; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm0
75 ; XOP-NEXT: vpxor %xmm2, %xmm2, %xmm2
76 ; XOP-NEXT: vpsubq %xmm1, %xmm2, %xmm1
82 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm1[2,3,0,1]
85 ; X32-SSE-NEXT: psrlq %xmm2, %xmm4
90 ; X32-SSE-NEXT: psrlq %xmm2, %xmm1
104 ; SSE2-NEXT: movdqa %xmm1, %xmm2
105 ; SSE2-NEXT: psrldq {{.*#+}} xmm2 = xmm2[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,ze…
107 ; SSE2-NEXT: psrad %xmm2, %xmm3
108 ; SSE2-NEXT: movdqa %xmm1, %xmm2
109 ; SSE2-NEXT: psrlq $32, %xmm2
111 ; SSE2-NEXT: psrad %xmm2, %xmm4
113 ; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm3[1,3,2,3]
123 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
128 ; SSE41-NEXT: movdqa %xmm1, %xmm2
129 ; SSE41-NEXT: psrldq {{.*#+}} xmm2 = xmm2[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,z…
131 ; SSE41-NEXT: psrad %xmm2, %xmm3
132 ; SSE41-NEXT: movdqa %xmm1, %xmm2
133 ; SSE41-NEXT: psrlq $32, %xmm2
135 ; SSE41-NEXT: psrad %xmm2, %xmm4
137 ; SSE41-NEXT: pxor %xmm2, %xmm2
139 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm1 = xmm1[2],xmm2[2],xmm1[3],xmm2[3]
140 ; SSE41-NEXT: movdqa %xmm0, %xmm2
141 ; SSE41-NEXT: psrad %xmm1, %xmm2
143 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]
149 ; AVX1-NEXT: vpsrldq {{.*#+}} xmm2 = xmm1[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,z…
150 ; AVX1-NEXT: vpsrad %xmm2, %xmm0, %xmm2
153 ; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
160 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]
170 ; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
171 ; XOPAVX1-NEXT: vpsubd %xmm1, %xmm2, %xmm1
182 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
183 ; X32-SSE-NEXT: psrldq {{.*#+}} xmm2 = xmm2[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero…
185 ; X32-SSE-NEXT: psrad %xmm2, %xmm3
186 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
187 ; X32-SSE-NEXT: psrlq $32, %xmm2
189 ; X32-SSE-NEXT: psrad %xmm2, %xmm4
191 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm3[1,3,2,3]
201 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
211 ; SSE2-NEXT: movdqa %xmm1, %xmm2
212 ; SSE2-NEXT: psraw $15, %xmm2
213 ; SSE2-NEXT: movdqa %xmm2, %xmm3
216 ; SSE2-NEXT: pand %xmm2, %xmm0
219 ; SSE2-NEXT: movdqa %xmm1, %xmm2
220 ; SSE2-NEXT: psraw $15, %xmm2
221 ; SSE2-NEXT: movdqa %xmm2, %xmm3
224 ; SSE2-NEXT: pand %xmm2, %xmm0
227 ; SSE2-NEXT: movdqa %xmm1, %xmm2
228 ; SSE2-NEXT: psraw $15, %xmm2
229 ; SSE2-NEXT: movdqa %xmm2, %xmm3
232 ; SSE2-NEXT: pand %xmm2, %xmm0
236 ; SSE2-NEXT: movdqa %xmm1, %xmm2
237 ; SSE2-NEXT: pandn %xmm0, %xmm2
240 ; SSE2-NEXT: por %xmm2, %xmm0
245 ; SSE41-NEXT: movdqa %xmm0, %xmm2
252 ; SSE41-NEXT: movdqa %xmm2, %xmm4
255 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
256 ; SSE41-NEXT: movdqa %xmm2, %xmm1
259 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
260 ; SSE41-NEXT: movdqa %xmm2, %xmm1
264 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
265 ; SSE41-NEXT: movdqa %xmm2, %xmm1
269 ; SSE41-NEXT: pblendvb %xmm1, %xmm2
270 ; SSE41-NEXT: movdqa %xmm2, %xmm0
275 ; AVX1-NEXT: vpsllw $12, %xmm1, %xmm2
277 ; AVX1-NEXT: vpor %xmm2, %xmm1, %xmm1
278 ; AVX1-NEXT: vpaddw %xmm1, %xmm1, %xmm2
282 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
284 ; AVX1-NEXT: vpaddw %xmm2, %xmm2, %xmm2
285 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
287 ; AVX1-NEXT: vpaddw %xmm2, %xmm2, %xmm2
288 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
303 ; XOP-NEXT: vpxor %xmm2, %xmm2, %xmm2
304 ; XOP-NEXT: vpsubw %xmm1, %xmm2, %xmm1
311 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
312 ; X32-SSE-NEXT: psraw $15, %xmm2
313 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
316 ; X32-SSE-NEXT: pand %xmm2, %xmm0
319 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
320 ; X32-SSE-NEXT: psraw $15, %xmm2
321 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
324 ; X32-SSE-NEXT: pand %xmm2, %xmm0
327 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
328 ; X32-SSE-NEXT: psraw $15, %xmm2
329 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
332 ; X32-SSE-NEXT: pand %xmm2, %xmm0
336 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
337 ; X32-SSE-NEXT: pandn %xmm0, %xmm2
340 ; X32-SSE-NEXT: por %xmm2, %xmm0
349 … {{.*#+}} xmm2 = xmm2[8],xmm0[8],xmm2[9],xmm0[9],xmm2[10],xmm0[10],xmm2[11],xmm0[11],xmm2[12],xmm0…
356 ; SSE2-NEXT: pandn %xmm2, %xmm6
357 ; SSE2-NEXT: psraw $4, %xmm2
358 ; SSE2-NEXT: pand %xmm5, %xmm2
359 ; SSE2-NEXT: por %xmm6, %xmm2
364 ; SSE2-NEXT: pandn %xmm2, %xmm6
365 ; SSE2-NEXT: psraw $2, %xmm2
366 ; SSE2-NEXT: pand %xmm5, %xmm2
367 ; SSE2-NEXT: por %xmm6, %xmm2
372 ; SSE2-NEXT: pandn %xmm2, %xmm4
373 ; SSE2-NEXT: psraw $1, %xmm2
374 ; SSE2-NEXT: pand %xmm5, %xmm2
375 ; SSE2-NEXT: por %xmm4, %xmm2
376 ; SSE2-NEXT: psrlw $8, %xmm2
402 ; SSE2-NEXT: packuswb %xmm2, %xmm0
407 ; SSE41-NEXT: movdqa %xmm0, %xmm2
410 …m3 = xmm3[8],xmm2[8],xmm3[9],xmm2[9],xmm3[10],xmm2[10],xmm3[11],xmm2[11],xmm3[12],xmm2[12],xmm3[13…
424 …}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],…
425 ; SSE41-NEXT: movdqa %xmm1, %xmm2
426 ; SSE41-NEXT: psraw $4, %xmm2
427 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
428 ; SSE41-NEXT: movdqa %xmm1, %xmm2
429 ; SSE41-NEXT: psraw $2, %xmm2
431 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
432 ; SSE41-NEXT: movdqa %xmm1, %xmm2
433 ; SSE41-NEXT: psraw $1, %xmm2
435 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
444 ; AVX-NEXT: vpunpckhbw {{.*#+}} xmm2 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11…
447 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
449 ; AVX-NEXT: vpaddw %xmm2, %xmm2, %xmm2
450 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
452 ; AVX-NEXT: vpaddw %xmm2, %xmm2, %xmm2
453 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
454 ; AVX-NEXT: vpsrlw $8, %xmm2, %xmm2
466 ; AVX-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
471 ; XOP-NEXT: vpxor %xmm2, %xmm2, %xmm2
472 ; XOP-NEXT: vpsubb %xmm1, %xmm2, %xmm1
478 … {{.*#+}} xmm2 = xmm2[8],xmm0[8],xmm2[9],xmm0[9],xmm2[10],xmm0[10],xmm2[11],xmm0[11],xmm2[12],xmm0…
485 ; X32-SSE-NEXT: pandn %xmm2, %xmm6
486 ; X32-SSE-NEXT: psraw $4, %xmm2
487 ; X32-SSE-NEXT: pand %xmm5, %xmm2
488 ; X32-SSE-NEXT: por %xmm6, %xmm2
493 ; X32-SSE-NEXT: pandn %xmm2, %xmm6
494 ; X32-SSE-NEXT: psraw $2, %xmm2
495 ; X32-SSE-NEXT: pand %xmm5, %xmm2
496 ; X32-SSE-NEXT: por %xmm6, %xmm2
501 ; X32-SSE-NEXT: pandn %xmm2, %xmm4
502 ; X32-SSE-NEXT: psraw $1, %xmm2
503 ; X32-SSE-NEXT: pand %xmm5, %xmm2
504 ; X32-SSE-NEXT: por %xmm4, %xmm2
505 ; X32-SSE-NEXT: psrlw $8, %xmm2
531 ; X32-SSE-NEXT: packuswb %xmm2, %xmm0
544 ; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
545 ; SSE-NEXT: psrlq %xmm1, %xmm2
547 ; SSE-NEXT: pxor %xmm2, %xmm0
548 ; SSE-NEXT: psubq %xmm2, %xmm0
553 ; AVX-NEXT: vmovdqa {{.*#+}} xmm2 = [9223372036854775808,9223372036854775808]
554 ; AVX-NEXT: vpsrlq %xmm1, %xmm2, %xmm2
556 ; AVX-NEXT: vpxor %xmm2, %xmm0, %xmm0
557 ; AVX-NEXT: vpsubq %xmm2, %xmm0, %xmm0
563 ; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
564 ; XOPAVX1-NEXT: vpsubq %xmm1, %xmm2, %xmm1
571 ; XOPAVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
572 ; XOPAVX2-NEXT: vpsubq %xmm1, %xmm2, %xmm1
579 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm2 = [0,2147483648,0,2147483648]
580 ; X32-SSE-NEXT: psrlq %xmm1, %xmm2
582 ; X32-SSE-NEXT: pxor %xmm2, %xmm0
583 ; X32-SSE-NEXT: psubq %xmm2, %xmm0
593 ; SSE2-NEXT: xorps %xmm2, %xmm2
594 ; SSE2-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
595 ; SSE2-NEXT: psrad %xmm2, %xmm0
600 ; SSE41-NEXT: pxor %xmm2, %xmm2
601 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0,1],xmm2[2,3,4,5,6,7]
602 ; SSE41-NEXT: psrad %xmm2, %xmm0
607 ; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
608 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
614 ; XOP-NEXT: vpxor %xmm2, %xmm2, %xmm2
615 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm2[2,3,4,5,6,7]
621 ; X32-SSE-NEXT: xorps %xmm2, %xmm2
622 ; X32-SSE-NEXT: movss {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3]
623 ; X32-SSE-NEXT: psrad %xmm2, %xmm0
641 ; SSE41-NEXT: pxor %xmm2, %xmm2
642 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm1[0],xmm2[1,2,3,4,5,6,7]
643 ; SSE41-NEXT: psraw %xmm2, %xmm0
648 ; AVX-NEXT: vpxor %xmm2, %xmm2, %xmm2
649 ; AVX-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
655 ; XOP-NEXT: vpxor %xmm2, %xmm2, %xmm2
656 ; XOP-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0],xmm2[1,2,3,4,5,6,7]
682 ; SSE2-NEXT: pxor %xmm2, %xmm2
725 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm2
726 ; SSE2-NEXT: movdqa %xmm2, %xmm3
729 ; SSE2-NEXT: pand %xmm2, %xmm0
737 ; SSE41-NEXT: movdqa %xmm0, %xmm2
742 …m3 = xmm3[8],xmm2[8],xmm3[9],xmm2[9],xmm3[10],xmm2[10],xmm3[11],xmm2[11],xmm3[12],xmm2[12],xmm3[13…
756 …}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],…
757 ; SSE41-NEXT: movdqa %xmm1, %xmm2
758 ; SSE41-NEXT: psraw $4, %xmm2
759 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
760 ; SSE41-NEXT: movdqa %xmm1, %xmm2
761 ; SSE41-NEXT: psraw $2, %xmm2
763 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
764 ; SSE41-NEXT: movdqa %xmm1, %xmm2
765 ; SSE41-NEXT: psraw $1, %xmm2
767 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
775 ; AVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
776 ; AVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
778 ; AVX1-NEXT: vpunpckhbw {{.*#+}} xmm2 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[1…
781 ; AVX1-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
783 ; AVX1-NEXT: vpaddw %xmm2, %xmm2, %xmm2
784 ; AVX1-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
786 ; AVX1-NEXT: vpaddw %xmm2, %xmm2, %xmm2
787 ; AVX1-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
788 ; AVX1-NEXT: vpsrlw $8, %xmm2, %xmm2
800 ; AVX1-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
807 ; AVX2-NEXT: vpunpckhbw {{.*#+}} xmm2 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[1…
810 ; AVX2-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
812 ; AVX2-NEXT: vpaddw %xmm2, %xmm2, %xmm2
813 ; AVX2-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
815 ; AVX2-NEXT: vpaddw %xmm2, %xmm2, %xmm2
816 ; AVX2-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
817 ; AVX2-NEXT: vpsrlw $8, %xmm2, %xmm2
829 ; AVX2-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
834 ; XOPAVX1-NEXT: vpxor %xmm2, %xmm2, %xmm2
835 ; XOPAVX1-NEXT: vpshufb %xmm2, %xmm1, %xmm1
836 ; XOPAVX1-NEXT: vpsubb %xmm1, %xmm2, %xmm1
843 ; XOPAVX2-NEXT: vpxor %xmm2, %xmm2, %xmm2
844 ; XOPAVX2-NEXT: vpsubb %xmm1, %xmm2, %xmm1
857 ; X32-SSE-NEXT: pxor %xmm2, %xmm2
900 ; X32-SSE-NEXT: pcmpgtw %xmm3, %xmm2
901 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
904 ; X32-SSE-NEXT: pand %xmm2, %xmm0
970 ; X32-SSE-NEXT: movdqa %xmm1, %xmm2
971 ; X32-SSE-NEXT: psrlq $7, %xmm2
973 ; X32-SSE-NEXT: movsd {{.*#+}} xmm2 = xmm1[0],xmm2[1]
978 ; X32-SSE-NEXT: xorpd %xmm2, %xmm1
979 ; X32-SSE-NEXT: psubq %xmm2, %xmm1
991 ; SSE2-NEXT: movdqa %xmm0, %xmm2
992 ; SSE2-NEXT: psrad $5, %xmm2
993 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]
995 ; SSE2-NEXT: movdqa %xmm0, %xmm2
996 ; SSE2-NEXT: psrad $6, %xmm2
998 ; SSE2-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
999 ; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
1007 ; SSE41-NEXT: movdqa %xmm0, %xmm2
1008 ; SSE41-NEXT: psrad $5, %xmm2
1009 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1,2,3],xmm1[4,5,6,7]
1014 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm2[2,3],xmm0[4,5],xmm2[6,7]
1020 ; AVX1-NEXT: vpsrad $5, %xmm0, %xmm2
1021 ; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm2[0,1,2,3],xmm1[4,5,6,7]
1022 ; AVX1-NEXT: vpsrad $6, %xmm0, %xmm2
1024 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm2[4,5,6,7]
1047 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
1048 ; X32-SSE-NEXT: psrad $5, %xmm2
1049 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm2[0],xmm1[1]
1051 ; X32-SSE-NEXT: movdqa %xmm0, %xmm2
1052 ; X32-SSE-NEXT: psrad $6, %xmm2
1054 ; X32-SSE-NEXT: movsd {{.*#+}} xmm2 = xmm0[0],xmm2[1]
1055 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm2[0,2,2,3]
1068 ; SSE2-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,2,2,3]
1071 ; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]
1073 ; SSE2-NEXT: movdqa %xmm2, %xmm1
1075 ; SSE2-NEXT: psraw $1, %xmm2
1076 ; SSE2-NEXT: pandn %xmm2, %xmm0
1083 ; SSE41-NEXT: movdqa %xmm1, %xmm2
1084 ; SSE41-NEXT: psraw $8, %xmm2
1086 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
1087 ; SSE41-NEXT: movdqa %xmm1, %xmm2
1088 ; SSE41-NEXT: psraw $4, %xmm2
1090 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
1091 ; SSE41-NEXT: movdqa %xmm1, %xmm2
1092 ; SSE41-NEXT: psraw $2, %xmm2
1094 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
1095 ; SSE41-NEXT: movdqa %xmm1, %xmm2
1096 ; SSE41-NEXT: psraw $1, %xmm2
1098 ; SSE41-NEXT: pblendvb %xmm2, %xmm1
1105 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,4112,8224,12336,16448,20560,24672,28784]
1106 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
1108 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,8224,16448,24672,32896,41120,49344,57568]
1109 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
1111 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,16448,32896,49344,256,16704,33152,49600]
1112 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
1114 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm2 = [0,32896,256,33152,512,33408,768,33664]
1115 ; AVX1-NEXT: vpblendvb %xmm2, %xmm1, %xmm0, %xmm0
1140 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm1[0,2,2,3]
1143 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1]
1145 ; X32-SSE-NEXT: movdqa %xmm2, %xmm1
1147 ; X32-SSE-NEXT: psraw $1, %xmm2
1148 ; X32-SSE-NEXT: pandn %xmm2, %xmm0
1162 ; SSE2-NEXT: pxor %xmm2, %xmm2
1205 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm2
1206 ; SSE2-NEXT: movdqa %xmm2, %xmm3
1209 ; SSE2-NEXT: pand %xmm2, %xmm0
1221 … {{.*#+}} xmm2 = xmm2[8],xmm1[8],xmm2[9],xmm1[9],xmm2[10],xmm1[10],xmm2[11],xmm1[11],xmm2[12],xmm1…
1222 ; SSE41-NEXT: movdqa %xmm2, %xmm4
1224 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
1225 ; SSE41-NEXT: movdqa %xmm2, %xmm4
1228 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
1229 ; SSE41-NEXT: movdqa %xmm2, %xmm4
1232 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
1233 ; SSE41-NEXT: psrlw $8, %xmm2
1248 ; SSE41-NEXT: packuswb %xmm2, %xmm1
1256 ; AVX-NEXT: vpunpckhbw {{.*#+}} xmm2 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11…
1259 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
1261 ; AVX-NEXT: vpaddw %xmm2, %xmm2, %xmm2
1262 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
1264 ; AVX-NEXT: vpaddw %xmm2, %xmm2, %xmm2
1265 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
1266 ; AVX-NEXT: vpsrlw $8, %xmm2, %xmm2
1278 ; AVX-NEXT: vpackuswb %xmm2, %xmm0, %xmm0
1294 ; X32-SSE-NEXT: pxor %xmm2, %xmm2
1337 ; X32-SSE-NEXT: pcmpgtw %xmm3, %xmm2
1338 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
1341 ; X32-SSE-NEXT: pand %xmm2, %xmm0