Lines Matching refs:xmm5
583 ; SSE2-NEXT: movdqa %xmm2, %xmm5
584 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm5
585 ; SSE2-NEXT: pand %xmm5, %xmm0
586 ; SSE2-NEXT: pandn %xmm2, %xmm5
587 ; SSE2-NEXT: por %xmm5, %xmm0
631 ; SSE2-NEXT: movdqa %xmm0, %xmm5
632 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm5
633 ; SSE2-NEXT: pxor %xmm5, %xmm7
634 ; SSE2-NEXT: pandn %xmm0, %xmm5
636 ; SSE2-NEXT: por %xmm7, %xmm5
640 ; SSE2-NEXT: movdqa %xmm5, %xmm0
679 ; SSE2-NEXT: movdqa %xmm0, %xmm5
680 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm5
681 ; SSE2-NEXT: pand %xmm5, %xmm0
682 ; SSE2-NEXT: pandn %xmm2, %xmm5
683 ; SSE2-NEXT: por %xmm0, %xmm5
687 ; SSE2-NEXT: movdqa %xmm5, %xmm0
727 ; SSE2-NEXT: movdqa %xmm6, %xmm5
728 ; SSE2-NEXT: pxor %xmm4, %xmm5
736 ; SSE2-NEXT: pandn %xmm3, %xmm5
737 ; SSE2-NEXT: por %xmm6, %xmm5
739 ; SSE2-NEXT: movdqa %xmm5, %xmm1
1024 ; SSE2-NEXT: movdqa %xmm1, %xmm5
1025 ; SSE2-NEXT: pxor %xmm4, %xmm5
1028 ; SSE2-NEXT: pcmpgtw %xmm5, %xmm6
1029 ; SSE2-NEXT: movdqa %xmm0, %xmm5
1030 ; SSE2-NEXT: pxor %xmm4, %xmm5
1032 ; SSE2-NEXT: pcmpgtw %xmm5, %xmm4
1078 ; SSE2-NEXT: movdqa %xmm0, %xmm5
1079 ; SSE2-NEXT: psubusw %xmm2, %xmm5
1080 ; SSE2-NEXT: pcmpeqw %xmm6, %xmm5
1081 ; SSE2-NEXT: pand %xmm5, %xmm0
1082 ; SSE2-NEXT: pandn %xmm2, %xmm5
1083 ; SSE2-NEXT: por %xmm0, %xmm5
1087 ; SSE2-NEXT: movdqa %xmm5, %xmm0
1124 ; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [32768,32768,32768,32768,32768,32768,32768,32768]
1126 ; SSE2-NEXT: pxor %xmm5, %xmm6
1128 ; SSE2-NEXT: pxor %xmm5, %xmm4
1131 ; SSE2-NEXT: pxor %xmm5, %xmm6
1132 ; SSE2-NEXT: pxor %xmm0, %xmm5
1133 ; SSE2-NEXT: pcmpgtw %xmm6, %xmm5
1134 ; SSE2-NEXT: pand %xmm5, %xmm0
1135 ; SSE2-NEXT: pandn %xmm2, %xmm5
1136 ; SSE2-NEXT: por %xmm5, %xmm0
1178 ; SSE2-NEXT: pxor %xmm5, %xmm5
1179 ; SSE2-NEXT: pcmpeqw %xmm5, %xmm4
1182 ; SSE2-NEXT: pcmpeqw %xmm5, %xmm6
1226 ; SSE2-NEXT: movdqa %xmm2, %xmm5
1227 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm5
1228 ; SSE2-NEXT: pand %xmm5, %xmm0
1229 ; SSE2-NEXT: pandn %xmm2, %xmm5
1230 ; SSE2-NEXT: por %xmm5, %xmm0
1274 ; SSE2-NEXT: movdqa %xmm0, %xmm5
1275 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm5
1276 ; SSE2-NEXT: pxor %xmm5, %xmm7
1277 ; SSE2-NEXT: pandn %xmm0, %xmm5
1279 ; SSE2-NEXT: por %xmm7, %xmm5
1283 ; SSE2-NEXT: movdqa %xmm5, %xmm0
1322 ; SSE2-NEXT: movdqa %xmm0, %xmm5
1323 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm5
1324 ; SSE2-NEXT: pand %xmm5, %xmm0
1325 ; SSE2-NEXT: pandn %xmm2, %xmm5
1326 ; SSE2-NEXT: por %xmm0, %xmm5
1330 ; SSE2-NEXT: movdqa %xmm5, %xmm0
1370 ; SSE2-NEXT: movdqa %xmm6, %xmm5
1371 ; SSE2-NEXT: pxor %xmm4, %xmm5
1379 ; SSE2-NEXT: pandn %xmm3, %xmm5
1380 ; SSE2-NEXT: por %xmm6, %xmm5
1382 ; SSE2-NEXT: movdqa %xmm5, %xmm1
1419 ; SSE2-NEXT: movdqa %xmm1, %xmm5
1420 ; SSE2-NEXT: pxor %xmm4, %xmm5
1423 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm6
1424 ; SSE2-NEXT: movdqa %xmm0, %xmm5
1425 ; SSE2-NEXT: pxor %xmm4, %xmm5
1427 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm4
1476 ; SSE2-NEXT: movdqa %xmm7, %xmm5
1477 ; SSE2-NEXT: pxor %xmm4, %xmm5
1487 ; SSE2-NEXT: pandn %xmm3, %xmm5
1488 ; SSE2-NEXT: por %xmm7, %xmm5
1490 ; SSE2-NEXT: movdqa %xmm5, %xmm1
1526 ; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]
1528 ; SSE2-NEXT: pxor %xmm5, %xmm6
1530 ; SSE2-NEXT: pxor %xmm5, %xmm4
1533 ; SSE2-NEXT: pxor %xmm5, %xmm6
1534 ; SSE2-NEXT: pxor %xmm0, %xmm5
1535 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
1536 ; SSE2-NEXT: pand %xmm5, %xmm0
1537 ; SSE2-NEXT: pandn %xmm2, %xmm5
1538 ; SSE2-NEXT: por %xmm5, %xmm0
1585 ; SSE2-NEXT: movdqa %xmm7, %xmm5
1586 ; SSE2-NEXT: pxor %xmm4, %xmm5
1596 ; SSE2-NEXT: pandn %xmm3, %xmm5
1597 ; SSE2-NEXT: por %xmm7, %xmm5
1599 ; SSE2-NEXT: movdqa %xmm5, %xmm1
2215 ; SSE2-NEXT: movdqa %xmm2, %xmm5
2216 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm5
2217 ; SSE2-NEXT: pand %xmm5, %xmm2
2218 ; SSE2-NEXT: pandn %xmm0, %xmm5
2219 ; SSE2-NEXT: por %xmm2, %xmm5
2223 ; SSE2-NEXT: movdqa %xmm5, %xmm0
2265 ; SSE2-NEXT: movdqa %xmm0, %xmm5
2266 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm5
2267 ; SSE2-NEXT: pxor %xmm5, %xmm7
2268 ; SSE2-NEXT: pandn %xmm2, %xmm5
2270 ; SSE2-NEXT: por %xmm7, %xmm5
2274 ; SSE2-NEXT: movdqa %xmm5, %xmm0
2313 ; SSE2-NEXT: movdqa %xmm0, %xmm5
2314 ; SSE2-NEXT: pcmpgtb %xmm2, %xmm5
2315 ; SSE2-NEXT: pand %xmm5, %xmm2
2316 ; SSE2-NEXT: pandn %xmm0, %xmm5
2317 ; SSE2-NEXT: por %xmm2, %xmm5
2321 ; SSE2-NEXT: movdqa %xmm5, %xmm0
2361 ; SSE2-NEXT: movdqa %xmm6, %xmm5
2362 ; SSE2-NEXT: pxor %xmm4, %xmm5
2370 ; SSE2-NEXT: pandn %xmm1, %xmm5
2371 ; SSE2-NEXT: por %xmm6, %xmm5
2373 ; SSE2-NEXT: movdqa %xmm5, %xmm1
2660 ; SSE2-NEXT: movdqa %xmm3, %xmm5
2661 ; SSE2-NEXT: pxor %xmm4, %xmm5
2662 ; SSE2-NEXT: pcmpgtw %xmm6, %xmm5
2670 ; SSE2-NEXT: pand %xmm5, %xmm3
2671 ; SSE2-NEXT: pandn %xmm1, %xmm5
2672 ; SSE2-NEXT: por %xmm3, %xmm5
2674 ; SSE2-NEXT: movdqa %xmm5, %xmm1
2714 ; SSE2-NEXT: movdqa %xmm0, %xmm5
2715 ; SSE2-NEXT: psubusw %xmm2, %xmm5
2716 ; SSE2-NEXT: pcmpeqw %xmm6, %xmm5
2717 ; SSE2-NEXT: pand %xmm5, %xmm2
2718 ; SSE2-NEXT: pandn %xmm0, %xmm5
2719 ; SSE2-NEXT: por %xmm2, %xmm5
2723 ; SSE2-NEXT: movdqa %xmm5, %xmm0
2763 ; SSE2-NEXT: movdqa %xmm1, %xmm5
2764 ; SSE2-NEXT: pxor %xmm4, %xmm5
2765 ; SSE2-NEXT: pcmpgtw %xmm6, %xmm5
2773 ; SSE2-NEXT: pand %xmm5, %xmm3
2774 ; SSE2-NEXT: pandn %xmm1, %xmm5
2775 ; SSE2-NEXT: por %xmm3, %xmm5
2777 ; SSE2-NEXT: movdqa %xmm5, %xmm1
2817 ; SSE2-NEXT: movdqa %xmm2, %xmm5
2818 ; SSE2-NEXT: psubusw %xmm0, %xmm5
2819 ; SSE2-NEXT: pcmpeqw %xmm6, %xmm5
2820 ; SSE2-NEXT: pand %xmm5, %xmm2
2821 ; SSE2-NEXT: pandn %xmm0, %xmm5
2822 ; SSE2-NEXT: por %xmm2, %xmm5
2826 ; SSE2-NEXT: movdqa %xmm5, %xmm0
2865 ; SSE2-NEXT: movdqa %xmm2, %xmm5
2866 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm5
2867 ; SSE2-NEXT: pand %xmm5, %xmm2
2868 ; SSE2-NEXT: pandn %xmm0, %xmm5
2869 ; SSE2-NEXT: por %xmm2, %xmm5
2873 ; SSE2-NEXT: movdqa %xmm5, %xmm0
2915 ; SSE2-NEXT: movdqa %xmm0, %xmm5
2916 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm5
2917 ; SSE2-NEXT: pxor %xmm5, %xmm7
2918 ; SSE2-NEXT: pandn %xmm2, %xmm5
2920 ; SSE2-NEXT: por %xmm7, %xmm5
2924 ; SSE2-NEXT: movdqa %xmm5, %xmm0
2963 ; SSE2-NEXT: movdqa %xmm0, %xmm5
2964 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm5
2965 ; SSE2-NEXT: pand %xmm5, %xmm2
2966 ; SSE2-NEXT: pandn %xmm0, %xmm5
2967 ; SSE2-NEXT: por %xmm2, %xmm5
2971 ; SSE2-NEXT: movdqa %xmm5, %xmm0
3011 ; SSE2-NEXT: movdqa %xmm6, %xmm5
3012 ; SSE2-NEXT: pxor %xmm4, %xmm5
3020 ; SSE2-NEXT: pandn %xmm1, %xmm5
3021 ; SSE2-NEXT: por %xmm6, %xmm5
3023 ; SSE2-NEXT: movdqa %xmm5, %xmm1
3062 ; SSE2-NEXT: movdqa %xmm3, %xmm5
3063 ; SSE2-NEXT: pxor %xmm4, %xmm5
3064 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
3072 ; SSE2-NEXT: pand %xmm5, %xmm3
3073 ; SSE2-NEXT: pandn %xmm1, %xmm5
3074 ; SSE2-NEXT: por %xmm3, %xmm5
3076 ; SSE2-NEXT: movdqa %xmm5, %xmm1
3119 ; SSE2-NEXT: movdqa %xmm7, %xmm5
3120 ; SSE2-NEXT: pxor %xmm4, %xmm5
3130 ; SSE2-NEXT: pandn %xmm1, %xmm5
3131 ; SSE2-NEXT: por %xmm7, %xmm5
3133 ; SSE2-NEXT: movdqa %xmm5, %xmm1
3172 ; SSE2-NEXT: movdqa %xmm1, %xmm5
3173 ; SSE2-NEXT: pxor %xmm4, %xmm5
3174 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
3182 ; SSE2-NEXT: pand %xmm5, %xmm3
3183 ; SSE2-NEXT: pandn %xmm1, %xmm5
3184 ; SSE2-NEXT: por %xmm3, %xmm5
3186 ; SSE2-NEXT: movdqa %xmm5, %xmm1
3229 ; SSE2-NEXT: movdqa %xmm7, %xmm5
3230 ; SSE2-NEXT: pxor %xmm4, %xmm5
3240 ; SSE2-NEXT: pandn %xmm1, %xmm5
3241 ; SSE2-NEXT: por %xmm7, %xmm5
3243 ; SSE2-NEXT: movdqa %xmm5, %xmm1
3285 ; SSE2-NEXT: movdqa %xmm5, %xmm10
3293 ; SSE2-NEXT: pandn %xmm5, %xmm10
3306 ; SSE4-NEXT: pminsb %xmm5, %xmm1
3314 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3315 ; AVX1-NEXT: vpminsb %xmm4, %xmm5, %xmm4
3356 ; SSE2-NEXT: pcmpgtb %xmm5, %xmm15
3366 ; SSE2-NEXT: pandn %xmm5, %xmm10
3381 ; SSE4-NEXT: pminsb %xmm5, %xmm1
3389 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3390 ; AVX1-NEXT: vpminsb %xmm4, %xmm5, %xmm4
3424 ; SSE2-NEXT: pcmpgtb %xmm5, %xmm10
3431 ; SSE2-NEXT: pandn %xmm5, %xmm10
3447 ; SSE4-NEXT: pmaxsb %xmm5, %xmm1
3455 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3456 ; AVX1-NEXT: vpmaxsb %xmm4, %xmm5, %xmm4
3497 ; SSE2-NEXT: movdqa %xmm5, %xmm14
3508 ; SSE2-NEXT: pandn %xmm5, %xmm11
3522 ; SSE4-NEXT: pmaxsb %xmm5, %xmm1
3530 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3531 ; AVX1-NEXT: vpmaxsb %xmm4, %xmm5, %xmm4
3561 ; SSE-NEXT: pminub %xmm5, %xmm1
3569 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3570 ; AVX1-NEXT: vpminub %xmm4, %xmm5, %xmm4
3600 ; SSE-NEXT: pminub %xmm5, %xmm1
3608 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3609 ; AVX1-NEXT: vpminub %xmm4, %xmm5, %xmm4
3639 ; SSE-NEXT: pmaxub %xmm5, %xmm1
3647 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3648 ; AVX1-NEXT: vpmaxub %xmm4, %xmm5, %xmm4
3678 ; SSE-NEXT: pmaxub %xmm5, %xmm1
3686 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3687 ; AVX1-NEXT: vpmaxub %xmm4, %xmm5, %xmm4
3717 ; SSE-NEXT: pminsw %xmm5, %xmm1
3725 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3726 ; AVX1-NEXT: vpminsw %xmm4, %xmm5, %xmm4
3756 ; SSE-NEXT: pminsw %xmm5, %xmm1
3764 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3765 ; AVX1-NEXT: vpminsw %xmm4, %xmm5, %xmm4
3795 ; SSE-NEXT: pmaxsw %xmm5, %xmm1
3803 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3804 ; AVX1-NEXT: vpmaxsw %xmm4, %xmm5, %xmm4
3834 ; SSE-NEXT: pmaxsw %xmm5, %xmm1
3842 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3843 ; AVX1-NEXT: vpmaxsw %xmm4, %xmm5, %xmm4
3885 ; SSE2-NEXT: movdqa %xmm5, %xmm12
3896 ; SSE2-NEXT: pandn %xmm5, %xmm12
3909 ; SSE4-NEXT: pminuw %xmm5, %xmm1
3917 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3918 ; AVX1-NEXT: vpminuw %xmm4, %xmm5, %xmm4
3955 ; SSE2-NEXT: psubusw %xmm5, %xmm1
3964 ; SSE2-NEXT: pandn %xmm5, %xmm1
3978 ; SSE4-NEXT: pminuw %xmm5, %xmm1
3986 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
3987 ; AVX1-NEXT: vpminuw %xmm4, %xmm5, %xmm4
4027 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4040 ; SSE2-NEXT: pandn %xmm5, %xmm10
4056 ; SSE4-NEXT: pmaxuw %xmm5, %xmm1
4064 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4065 ; AVX1-NEXT: vpmaxuw %xmm4, %xmm5, %xmm4
4101 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4111 ; SSE2-NEXT: pandn %xmm5, %xmm11
4124 ; SSE4-NEXT: pmaxuw %xmm5, %xmm1
4132 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4133 ; AVX1-NEXT: vpmaxuw %xmm4, %xmm5, %xmm4
4166 ; SSE2-NEXT: movdqa %xmm5, %xmm10
4174 ; SSE2-NEXT: pandn %xmm5, %xmm10
4187 ; SSE4-NEXT: pminsd %xmm5, %xmm1
4195 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4196 ; AVX1-NEXT: vpminsd %xmm4, %xmm5, %xmm4
4237 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm15
4247 ; SSE2-NEXT: pandn %xmm5, %xmm10
4262 ; SSE4-NEXT: pminsd %xmm5, %xmm1
4270 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4271 ; AVX1-NEXT: vpminsd %xmm4, %xmm5, %xmm4
4305 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm10
4312 ; SSE2-NEXT: pandn %xmm5, %xmm10
4328 ; SSE4-NEXT: pmaxsd %xmm5, %xmm1
4336 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4337 ; AVX1-NEXT: vpmaxsd %xmm4, %xmm5, %xmm4
4378 ; SSE2-NEXT: movdqa %xmm5, %xmm14
4389 ; SSE2-NEXT: pandn %xmm5, %xmm11
4403 ; SSE4-NEXT: pmaxsd %xmm5, %xmm1
4411 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4412 ; AVX1-NEXT: vpmaxsd %xmm4, %xmm5, %xmm4
4454 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4465 ; SSE2-NEXT: pandn %xmm5, %xmm12
4478 ; SSE4-NEXT: pminud %xmm5, %xmm1
4486 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4487 ; AVX1-NEXT: vpminud %xmm4, %xmm5, %xmm4
4533 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4549 ; SSE2-NEXT: pandn %xmm5, %xmm11
4565 ; SSE4-NEXT: pminud %xmm5, %xmm1
4573 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4574 ; AVX1-NEXT: vpminud %xmm4, %xmm5, %xmm4
4614 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4627 ; SSE2-NEXT: pandn %xmm5, %xmm10
4643 ; SSE4-NEXT: pmaxud %xmm5, %xmm1
4651 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4652 ; AVX1-NEXT: vpmaxud %xmm4, %xmm5, %xmm4
4700 ; SSE2-NEXT: movdqa %xmm5, %xmm15
4714 ; SSE2-NEXT: pandn %xmm5, %xmm11
4730 ; SSE4-NEXT: pmaxud %xmm5, %xmm1
4738 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4739 ; AVX1-NEXT: vpmaxud %xmm4, %xmm5, %xmm4
4795 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4820 ; SSE2-NEXT: pandn %xmm5, %xmm12
4837 ; SSE4-NEXT: movdqa %xmm5, %xmm11
4843 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
4849 ; SSE4-NEXT: movapd %xmm5, %xmm1
4857 ; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
4858 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
4859 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
4861 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
4863 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
4865 ; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
4924 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4956 ; SSE2-NEXT: pandn %xmm5, %xmm11
4981 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
4987 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
4993 ; SSE4-NEXT: movapd %xmm5, %xmm1
5001 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
5002 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
5003 ; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
5004 ; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4
5006 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
5011 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
5013 ; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm5
5068 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5095 ; SSE2-NEXT: pandn %xmm5, %xmm12
5113 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
5117 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
5123 ; SSE4-NEXT: movapd %xmm5, %xmm1
5131 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
5132 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
5133 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm5
5135 ; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5
5137 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
5139 ; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
5201 ; SSE2-NEXT: movdqa %xmm5, %xmm14
5231 ; SSE2-NEXT: pandn %xmm5, %xmm11
5255 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5263 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
5269 ; SSE4-NEXT: movapd %xmm5, %xmm1
5277 ; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
5278 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
5279 ; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
5280 ; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4
5282 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
5287 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
5289 ; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm5
5346 ; SSE2-NEXT: movdqa %xmm5, %xmm12
5371 ; SSE2-NEXT: pandn %xmm5, %xmm12
5397 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5406 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
5412 ; SSE4-NEXT: movapd %xmm5, %xmm1
5420 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
5421 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
5423 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5425 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm6
5426 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
5430 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5432 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
5434 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm7
5435 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm5
5436 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
5501 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5533 ; SSE2-NEXT: pandn %xmm5, %xmm11
5564 ; SSE4-NEXT: movdqa %xmm5, %xmm13
5577 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
5583 ; SSE4-NEXT: movapd %xmm5, %xmm1
5591 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
5592 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
5594 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5598 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
5599 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm6
5604 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5606 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
5609 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm7
5610 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm5
5611 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
5612 ; AVX1-NEXT: vpxor %xmm8, %xmm5, %xmm5
5672 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5699 ; SSE2-NEXT: pandn %xmm5, %xmm12
5723 ; SSE4-NEXT: movdqa %xmm5, %xmm12
5734 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
5740 ; SSE4-NEXT: movapd %xmm5, %xmm1
5748 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
5749 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
5751 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5753 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
5754 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm7
5758 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5760 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
5762 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm7
5763 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm5
5764 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
5832 ; SSE2-NEXT: movdqa %xmm5, %xmm14
5862 ; SSE2-NEXT: pandn %xmm5, %xmm11
5895 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5906 ; SSE4-NEXT: blendvpd %xmm1, %xmm5
5912 ; SSE4-NEXT: movapd %xmm5, %xmm1
5920 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
5921 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
5923 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5927 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm7
5928 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
5933 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
5935 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
5938 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm7
5939 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm5
5940 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
5941 ; AVX1-NEXT: vpxor %xmm8, %xmm5, %xmm5
5981 ; SSE2-NEXT: movdqa %xmm5, %xmm10
5988 ; SSE2-NEXT: pand %xmm10, %xmm5
5990 ; SSE2-NEXT: por %xmm5, %xmm10
6005 ; SSE4-NEXT: pmaxsb %xmm5, %xmm1
6013 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6014 ; AVX1-NEXT: vpmaxsb %xmm4, %xmm5, %xmm4
6054 ; SSE2-NEXT: pcmpgtb %xmm5, %xmm15
6063 ; SSE2-NEXT: pandn %xmm5, %xmm15
6080 ; SSE4-NEXT: pmaxsb %xmm5, %xmm1
6088 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6089 ; AVX1-NEXT: vpmaxsb %xmm4, %xmm5, %xmm4
6123 ; SSE2-NEXT: pcmpgtb %xmm5, %xmm10
6129 ; SSE2-NEXT: pand %xmm10, %xmm5
6131 ; SSE2-NEXT: por %xmm5, %xmm10
6146 ; SSE4-NEXT: pminsb %xmm5, %xmm1
6154 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6155 ; AVX1-NEXT: vpminsb %xmm4, %xmm5, %xmm4
6195 ; SSE2-NEXT: movdqa %xmm5, %xmm14
6205 ; SSE2-NEXT: pandn %xmm5, %xmm14
6221 ; SSE4-NEXT: pminsb %xmm5, %xmm1
6229 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6230 ; AVX1-NEXT: vpminsb %xmm4, %xmm5, %xmm4
6260 ; SSE-NEXT: pmaxub %xmm5, %xmm1
6268 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6269 ; AVX1-NEXT: vpmaxub %xmm4, %xmm5, %xmm4
6299 ; SSE-NEXT: pmaxub %xmm5, %xmm1
6307 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6308 ; AVX1-NEXT: vpmaxub %xmm4, %xmm5, %xmm4
6338 ; SSE-NEXT: pminub %xmm5, %xmm1
6346 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6347 ; AVX1-NEXT: vpminub %xmm4, %xmm5, %xmm4
6377 ; SSE-NEXT: pminub %xmm5, %xmm1
6385 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6386 ; AVX1-NEXT: vpminub %xmm4, %xmm5, %xmm4
6416 ; SSE-NEXT: pmaxsw %xmm5, %xmm1
6424 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6425 ; AVX1-NEXT: vpmaxsw %xmm4, %xmm5, %xmm4
6455 ; SSE-NEXT: pmaxsw %xmm5, %xmm1
6463 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6464 ; AVX1-NEXT: vpmaxsw %xmm4, %xmm5, %xmm4
6494 ; SSE-NEXT: pminsw %xmm5, %xmm1
6502 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6503 ; AVX1-NEXT: vpminsw %xmm4, %xmm5, %xmm4
6533 ; SSE-NEXT: pminsw %xmm5, %xmm1
6541 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6542 ; AVX1-NEXT: vpminsw %xmm4, %xmm5, %xmm4
6585 ; SSE2-NEXT: movdqa %xmm5, %xmm10
6595 ; SSE2-NEXT: pand %xmm10, %xmm5
6597 ; SSE2-NEXT: por %xmm5, %xmm10
6612 ; SSE4-NEXT: pmaxuw %xmm5, %xmm1
6620 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6621 ; AVX1-NEXT: vpmaxuw %xmm4, %xmm5, %xmm4
6658 ; SSE2-NEXT: psubusw %xmm5, %xmm1
6666 ; SSE2-NEXT: pand %xmm1, %xmm5
6668 ; SSE2-NEXT: por %xmm5, %xmm1
6681 ; SSE4-NEXT: pmaxuw %xmm5, %xmm1
6689 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6690 ; AVX1-NEXT: vpmaxuw %xmm4, %xmm5, %xmm4
6731 ; SSE2-NEXT: movdqa %xmm5, %xmm12
6743 ; SSE2-NEXT: pand %xmm10, %xmm5
6745 ; SSE2-NEXT: por %xmm5, %xmm10
6760 ; SSE4-NEXT: pminuw %xmm5, %xmm1
6768 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6769 ; AVX1-NEXT: vpminuw %xmm4, %xmm5, %xmm4
6808 ; SSE2-NEXT: movdqa %xmm5, %xmm1
6817 ; SSE2-NEXT: pand %xmm1, %xmm5
6819 ; SSE2-NEXT: por %xmm5, %xmm1
6832 ; SSE4-NEXT: pminuw %xmm5, %xmm1
6840 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6841 ; AVX1-NEXT: vpminuw %xmm4, %xmm5, %xmm4
6875 ; SSE2-NEXT: movdqa %xmm5, %xmm10
6882 ; SSE2-NEXT: pand %xmm10, %xmm5
6884 ; SSE2-NEXT: por %xmm5, %xmm10
6899 ; SSE4-NEXT: pmaxsd %xmm5, %xmm1
6907 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6908 ; AVX1-NEXT: vpmaxsd %xmm4, %xmm5, %xmm4
6948 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm15
6957 ; SSE2-NEXT: pandn %xmm5, %xmm15
6974 ; SSE4-NEXT: pmaxsd %xmm5, %xmm1
6982 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
6983 ; AVX1-NEXT: vpmaxsd %xmm4, %xmm5, %xmm4
7017 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm10
7023 ; SSE2-NEXT: pand %xmm10, %xmm5
7025 ; SSE2-NEXT: por %xmm5, %xmm10
7040 ; SSE4-NEXT: pminsd %xmm5, %xmm1
7048 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
7049 ; AVX1-NEXT: vpminsd %xmm4, %xmm5, %xmm4
7089 ; SSE2-NEXT: movdqa %xmm5, %xmm14
7099 ; SSE2-NEXT: pandn %xmm5, %xmm14
7115 ; SSE4-NEXT: pminsd %xmm5, %xmm1
7123 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
7124 ; AVX1-NEXT: vpminsd %xmm4, %xmm5, %xmm4
7167 ; SSE2-NEXT: movdqa %xmm5, %xmm10
7177 ; SSE2-NEXT: pand %xmm10, %xmm5
7179 ; SSE2-NEXT: por %xmm5, %xmm10
7194 ; SSE4-NEXT: pmaxud %xmm5, %xmm1
7202 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
7203 ; AVX1-NEXT: vpmaxud %xmm4, %xmm5, %xmm4
7249 ; SSE2-NEXT: movdqa %xmm5, %xmm11
7264 ; SSE2-NEXT: pandn %xmm5, %xmm15
7281 ; SSE4-NEXT: pmaxud %xmm5, %xmm1
7289 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
7290 ; AVX1-NEXT: vpmaxud %xmm4, %xmm5, %xmm4
7331 ; SSE2-NEXT: movdqa %xmm5, %xmm12
7343 ; SSE2-NEXT: pand %xmm10, %xmm5
7345 ; SSE2-NEXT: por %xmm5, %xmm10
7360 ; SSE4-NEXT: pminud %xmm5, %xmm1
7368 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
7369 ; AVX1-NEXT: vpminud %xmm4, %xmm5, %xmm4
7417 ; SSE2-NEXT: movdqa %xmm5, %xmm15
7430 ; SSE2-NEXT: pandn %xmm5, %xmm15
7447 ; SSE4-NEXT: pminud %xmm5, %xmm1
7455 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
7456 ; AVX1-NEXT: vpminud %xmm4, %xmm5, %xmm4
7514 ; SSE2-NEXT: movdqa %xmm5, %xmm12
7538 ; SSE2-NEXT: pand %xmm10, %xmm5
7540 ; SSE2-NEXT: por %xmm5, %xmm10
7560 ; SSE4-NEXT: movdqa %xmm5, %xmm11
7566 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
7577 ; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
7578 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
7579 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
7581 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm5
7583 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
7585 ; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
7644 ; SSE2-NEXT: movdqa %xmm5, %xmm11
7675 ; SSE2-NEXT: pandn %xmm5, %xmm15
7701 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
7707 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
7718 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
7719 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
7720 ; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
7721 ; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4
7723 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
7728 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
7730 ; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm5
7785 ; SSE2-NEXT: movdqa %xmm5, %xmm10
7811 ; SSE2-NEXT: pand %xmm10, %xmm5
7813 ; SSE2-NEXT: por %xmm5, %xmm10
7834 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
7838 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
7849 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm5
7850 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
7851 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm5
7853 ; AVX1-NEXT: vextractf128 $1, %ymm2, %xmm5
7855 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm6, %xmm5
7857 ; AVX1-NEXT: vinsertf128 $1, %xmm5, %ymm6, %ymm5
7919 ; SSE2-NEXT: movdqa %xmm5, %xmm14
7948 ; SSE2-NEXT: pandn %xmm5, %xmm15
7973 ; SSE4-NEXT: movdqa %xmm5, %xmm11
7981 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
7992 ; AVX1-NEXT: vextractf128 $1, %ymm3, %xmm5
7993 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm5, %xmm4
7994 ; AVX1-NEXT: vpcmpeqd %xmm5, %xmm5, %xmm5
7995 ; AVX1-NEXT: vpxor %xmm5, %xmm4, %xmm4
7997 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
8002 ; AVX1-NEXT: vpxor %xmm5, %xmm6, %xmm6
8004 ; AVX1-NEXT: vpxor %xmm5, %xmm7, %xmm5
8061 ; SSE2-NEXT: movdqa %xmm5, %xmm12
8085 ; SSE2-NEXT: pand %xmm10, %xmm5
8087 ; SSE2-NEXT: por %xmm5, %xmm10
8116 ; SSE4-NEXT: movdqa %xmm5, %xmm11
8125 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
8136 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
8137 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
8139 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8141 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm6
8142 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
8146 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8148 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
8150 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm7
8151 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm5
8152 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
8217 ; SSE2-NEXT: movdqa %xmm5, %xmm11
8248 ; SSE2-NEXT: pandn %xmm5, %xmm15
8280 ; SSE4-NEXT: movdqa %xmm5, %xmm13
8293 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
8304 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
8305 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
8307 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8311 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
8312 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm6
8317 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8319 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
8322 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm7
8323 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm5
8324 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
8325 ; AVX1-NEXT: vpxor %xmm8, %xmm5, %xmm5
8385 ; SSE2-NEXT: movdqa %xmm5, %xmm10
8411 ; SSE2-NEXT: pand %xmm10, %xmm5
8413 ; SSE2-NEXT: por %xmm5, %xmm10
8440 ; SSE4-NEXT: movdqa %xmm5, %xmm12
8451 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
8462 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
8463 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
8465 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8467 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
8468 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm7
8472 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8474 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
8476 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm7
8477 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm5
8478 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
8546 ; SSE2-NEXT: movdqa %xmm5, %xmm14
8575 ; SSE2-NEXT: pandn %xmm5, %xmm15
8609 ; SSE4-NEXT: movdqa %xmm5, %xmm11
8620 ; SSE4-NEXT: blendvpd %xmm5, %xmm1
8631 ; AVX1-NEXT: vmovaps {{.*#+}} xmm5 = [9223372036854775808,9223372036854775808]
8632 ; AVX1-NEXT: vxorps %xmm5, %xmm4, %xmm4
8634 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8638 ; AVX1-NEXT: vxorps %xmm5, %xmm1, %xmm7
8639 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
8644 ; AVX1-NEXT: vxorps %xmm5, %xmm6, %xmm6
8646 ; AVX1-NEXT: vxorps %xmm5, %xmm7, %xmm7
8649 ; AVX1-NEXT: vxorps %xmm5, %xmm0, %xmm7
8650 ; AVX1-NEXT: vxorps %xmm5, %xmm2, %xmm5
8651 ; AVX1-NEXT: vpcmpgtq %xmm7, %xmm5, %xmm5
8652 ; AVX1-NEXT: vpxor %xmm8, %xmm5, %xmm5
8688 ; SSE2-NEXT: movdqa %xmm1, %xmm5
8689 ; SSE2-NEXT: pxor %xmm4, %xmm5
8693 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
8695 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm6
8696 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm6[1,1,3,3]
8697 ; SSE2-NEXT: pand %xmm8, %xmm5
8699 ; SSE2-NEXT: por %xmm5, %xmm6
8700 ; SSE2-NEXT: movdqa %xmm0, %xmm5
8701 ; SSE2-NEXT: pxor %xmm4, %xmm5
8704 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
8706 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm4
8709 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
8710 ; SSE2-NEXT: por %xmm4, %xmm5
8711 ; SSE2-NEXT: pand %xmm5, %xmm0
8712 ; SSE2-NEXT: pandn %xmm2, %xmm5
8713 ; SSE2-NEXT: por %xmm5, %xmm0
8722 ; SSE4-NEXT: movdqa %xmm3, %xmm5
8723 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm5
8727 ; SSE4-NEXT: movdqa %xmm5, %xmm0
8765 ; SSE2-NEXT: movdqa %xmm1, %xmm5
8766 ; SSE2-NEXT: pxor %xmm7, %xmm5
8767 ; SSE2-NEXT: movdqa %xmm5, %xmm6
8770 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
8771 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
8781 ; SSE2-NEXT: movdqa %xmm7, %xmm5
8782 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
8783 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
8787 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
8788 ; SSE2-NEXT: por %xmm6, %xmm5
8789 ; SSE2-NEXT: pxor %xmm5, %xmm4
8790 ; SSE2-NEXT: pandn %xmm0, %xmm5
8792 ; SSE2-NEXT: por %xmm5, %xmm4
8803 ; SSE4-NEXT: movdqa %xmm1, %xmm5
8804 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
8806 ; SSE4-NEXT: pxor %xmm6, %xmm5
8810 ; SSE4-NEXT: movdqa %xmm5, %xmm0
8851 ; SSE2-NEXT: movdqa %xmm3, %xmm5
8852 ; SSE2-NEXT: pxor %xmm4, %xmm5
8856 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
8858 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm6
8859 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm6[1,1,3,3]
8860 ; SSE2-NEXT: pand %xmm8, %xmm5
8862 ; SSE2-NEXT: por %xmm5, %xmm6
8863 ; SSE2-NEXT: movdqa %xmm2, %xmm5
8864 ; SSE2-NEXT: pxor %xmm4, %xmm5
8867 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
8869 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm4
8872 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
8873 ; SSE2-NEXT: por %xmm4, %xmm5
8874 ; SSE2-NEXT: pand %xmm5, %xmm0
8875 ; SSE2-NEXT: pandn %xmm2, %xmm5
8876 ; SSE2-NEXT: por %xmm5, %xmm0
8885 ; SSE4-NEXT: movdqa %xmm1, %xmm5
8886 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
8889 ; SSE4-NEXT: movdqa %xmm5, %xmm0
8927 ; SSE2-NEXT: movdqa %xmm3, %xmm5
8928 ; SSE2-NEXT: pxor %xmm7, %xmm5
8929 ; SSE2-NEXT: movdqa %xmm5, %xmm6
8932 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
8933 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
8943 ; SSE2-NEXT: movdqa %xmm7, %xmm5
8944 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
8945 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
8949 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
8950 ; SSE2-NEXT: por %xmm6, %xmm5
8951 ; SSE2-NEXT: pxor %xmm5, %xmm4
8952 ; SSE2-NEXT: pandn %xmm0, %xmm5
8954 ; SSE2-NEXT: por %xmm5, %xmm4
8965 ; SSE4-NEXT: movdqa %xmm3, %xmm5
8966 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm5
8968 ; SSE4-NEXT: pxor %xmm0, %xmm5
8973 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9014 ; SSE2-NEXT: movdqa %xmm1, %xmm5
9015 ; SSE2-NEXT: pxor %xmm4, %xmm5
9019 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
9021 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm6
9022 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm6[1,1,3,3]
9023 ; SSE2-NEXT: pand %xmm8, %xmm5
9025 ; SSE2-NEXT: por %xmm5, %xmm6
9026 ; SSE2-NEXT: movdqa %xmm0, %xmm5
9027 ; SSE2-NEXT: pxor %xmm4, %xmm5
9030 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
9032 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm4
9035 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
9036 ; SSE2-NEXT: por %xmm4, %xmm5
9037 ; SSE2-NEXT: pand %xmm5, %xmm0
9038 ; SSE2-NEXT: pandn %xmm2, %xmm5
9039 ; SSE2-NEXT: por %xmm5, %xmm0
9051 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9052 ; SSE4-NEXT: pxor %xmm0, %xmm5
9053 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
9059 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9105 ; SSE2-NEXT: movdqa %xmm1, %xmm5
9106 ; SSE2-NEXT: pxor %xmm7, %xmm5
9107 ; SSE2-NEXT: movdqa %xmm5, %xmm6
9110 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
9111 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
9121 ; SSE2-NEXT: movdqa %xmm7, %xmm5
9122 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
9123 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
9127 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
9128 ; SSE2-NEXT: por %xmm6, %xmm5
9129 ; SSE2-NEXT: pxor %xmm5, %xmm4
9130 ; SSE2-NEXT: pandn %xmm0, %xmm5
9132 ; SSE2-NEXT: por %xmm5, %xmm4
9146 ; SSE4-NEXT: movdqa %xmm1, %xmm5
9147 ; SSE4-NEXT: pxor %xmm0, %xmm5
9148 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
9150 ; SSE4-NEXT: pxor %xmm6, %xmm5
9157 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9173 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm5
9175 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
9206 ; SSE2-NEXT: movdqa %xmm3, %xmm5
9207 ; SSE2-NEXT: pxor %xmm4, %xmm5
9211 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
9213 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm6
9214 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm6[1,1,3,3]
9215 ; SSE2-NEXT: pand %xmm8, %xmm5
9217 ; SSE2-NEXT: por %xmm5, %xmm6
9218 ; SSE2-NEXT: movdqa %xmm2, %xmm5
9219 ; SSE2-NEXT: pxor %xmm4, %xmm5
9222 ; SSE2-NEXT: pcmpgtd %xmm5, %xmm7
9224 ; SSE2-NEXT: pcmpeqd %xmm5, %xmm4
9227 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
9228 ; SSE2-NEXT: por %xmm4, %xmm5
9229 ; SSE2-NEXT: pand %xmm5, %xmm0
9230 ; SSE2-NEXT: pandn %xmm2, %xmm5
9231 ; SSE2-NEXT: por %xmm5, %xmm0
9243 ; SSE4-NEXT: movdqa %xmm1, %xmm5
9244 ; SSE4-NEXT: pxor %xmm0, %xmm5
9245 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
9251 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9297 ; SSE2-NEXT: movdqa %xmm3, %xmm5
9298 ; SSE2-NEXT: pxor %xmm7, %xmm5
9299 ; SSE2-NEXT: movdqa %xmm5, %xmm6
9302 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
9303 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
9313 ; SSE2-NEXT: movdqa %xmm7, %xmm5
9314 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
9315 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
9319 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
9320 ; SSE2-NEXT: por %xmm6, %xmm5
9321 ; SSE2-NEXT: pxor %xmm5, %xmm4
9322 ; SSE2-NEXT: pandn %xmm0, %xmm5
9324 ; SSE2-NEXT: por %xmm5, %xmm4
9338 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9339 ; SSE4-NEXT: pxor %xmm0, %xmm5
9340 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
9342 ; SSE4-NEXT: pxor %xmm6, %xmm5
9349 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9365 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm5
9367 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
9397 ; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,0,2147483648,0]
9399 ; SSE2-NEXT: pxor %xmm5, %xmm4
9401 ; SSE2-NEXT: pxor %xmm5, %xmm6
9411 ; SSE2-NEXT: pxor %xmm5, %xmm6
9412 ; SSE2-NEXT: pxor %xmm2, %xmm5
9413 ; SSE2-NEXT: movdqa %xmm5, %xmm7
9416 ; SSE2-NEXT: pcmpeqd %xmm6, %xmm5
9417 ; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm5[1,1,3,3]
9419 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
9420 ; SSE2-NEXT: por %xmm6, %xmm5
9421 ; SSE2-NEXT: pand %xmm5, %xmm2
9422 ; SSE2-NEXT: pandn %xmm0, %xmm5
9423 ; SSE2-NEXT: por %xmm2, %xmm5
9427 ; SSE2-NEXT: movdqa %xmm5, %xmm0
9434 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9435 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm5
9439 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9476 ; SSE2-NEXT: movdqa %xmm1, %xmm5
9477 ; SSE2-NEXT: pxor %xmm7, %xmm5
9478 ; SSE2-NEXT: movdqa %xmm5, %xmm6
9481 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
9482 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
9492 ; SSE2-NEXT: movdqa %xmm7, %xmm5
9493 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
9494 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
9498 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
9499 ; SSE2-NEXT: por %xmm6, %xmm5
9500 ; SSE2-NEXT: pxor %xmm5, %xmm4
9501 ; SSE2-NEXT: pandn %xmm2, %xmm5
9503 ; SSE2-NEXT: por %xmm5, %xmm4
9514 ; SSE4-NEXT: movdqa %xmm1, %xmm5
9515 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
9517 ; SSE4-NEXT: pxor %xmm6, %xmm5
9521 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9560 ; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,0,2147483648,0]
9562 ; SSE2-NEXT: pxor %xmm5, %xmm4
9564 ; SSE2-NEXT: pxor %xmm5, %xmm6
9574 ; SSE2-NEXT: pxor %xmm5, %xmm6
9575 ; SSE2-NEXT: pxor %xmm0, %xmm5
9576 ; SSE2-NEXT: movdqa %xmm5, %xmm7
9579 ; SSE2-NEXT: pcmpeqd %xmm6, %xmm5
9580 ; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm5[1,1,3,3]
9582 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
9583 ; SSE2-NEXT: por %xmm6, %xmm5
9584 ; SSE2-NEXT: pand %xmm5, %xmm2
9585 ; SSE2-NEXT: pandn %xmm0, %xmm5
9586 ; SSE2-NEXT: por %xmm2, %xmm5
9590 ; SSE2-NEXT: movdqa %xmm5, %xmm0
9597 ; SSE4-NEXT: movdqa %xmm1, %xmm5
9598 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
9601 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9638 ; SSE2-NEXT: movdqa %xmm3, %xmm5
9639 ; SSE2-NEXT: pxor %xmm7, %xmm5
9640 ; SSE2-NEXT: movdqa %xmm5, %xmm6
9643 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
9644 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
9654 ; SSE2-NEXT: movdqa %xmm7, %xmm5
9655 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
9656 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
9660 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
9661 ; SSE2-NEXT: por %xmm6, %xmm5
9662 ; SSE2-NEXT: pxor %xmm5, %xmm4
9663 ; SSE2-NEXT: pandn %xmm2, %xmm5
9665 ; SSE2-NEXT: por %xmm5, %xmm4
9676 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9677 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm5
9679 ; SSE4-NEXT: pxor %xmm0, %xmm5
9684 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9723 ; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]
9725 ; SSE2-NEXT: pxor %xmm5, %xmm4
9727 ; SSE2-NEXT: pxor %xmm5, %xmm6
9737 ; SSE2-NEXT: pxor %xmm5, %xmm6
9738 ; SSE2-NEXT: pxor %xmm2, %xmm5
9739 ; SSE2-NEXT: movdqa %xmm5, %xmm7
9742 ; SSE2-NEXT: pcmpeqd %xmm6, %xmm5
9743 ; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm5[1,1,3,3]
9745 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
9746 ; SSE2-NEXT: por %xmm6, %xmm5
9747 ; SSE2-NEXT: pand %xmm5, %xmm2
9748 ; SSE2-NEXT: pandn %xmm0, %xmm5
9749 ; SSE2-NEXT: por %xmm2, %xmm5
9753 ; SSE2-NEXT: movdqa %xmm5, %xmm0
9763 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9764 ; SSE4-NEXT: pxor %xmm0, %xmm5
9765 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
9771 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9816 ; SSE2-NEXT: movdqa %xmm1, %xmm5
9817 ; SSE2-NEXT: pxor %xmm7, %xmm5
9818 ; SSE2-NEXT: movdqa %xmm5, %xmm6
9821 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
9822 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
9832 ; SSE2-NEXT: movdqa %xmm7, %xmm5
9833 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
9834 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
9838 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
9839 ; SSE2-NEXT: por %xmm6, %xmm5
9840 ; SSE2-NEXT: pxor %xmm5, %xmm4
9841 ; SSE2-NEXT: pandn %xmm2, %xmm5
9843 ; SSE2-NEXT: por %xmm5, %xmm4
9857 ; SSE4-NEXT: movdqa %xmm1, %xmm5
9858 ; SSE4-NEXT: pxor %xmm0, %xmm5
9859 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
9861 ; SSE4-NEXT: pxor %xmm6, %xmm5
9868 ; SSE4-NEXT: movdqa %xmm5, %xmm0
9883 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm5
9885 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
9915 ; SSE2-NEXT: movdqa {{.*#+}} xmm5 = [2147483648,2147483648,2147483648,2147483648]
9917 ; SSE2-NEXT: pxor %xmm5, %xmm4
9919 ; SSE2-NEXT: pxor %xmm5, %xmm6
9929 ; SSE2-NEXT: pxor %xmm5, %xmm6
9930 ; SSE2-NEXT: pxor %xmm0, %xmm5
9931 ; SSE2-NEXT: movdqa %xmm5, %xmm7
9934 ; SSE2-NEXT: pcmpeqd %xmm6, %xmm5
9935 ; SSE2-NEXT: pshufd {{.*#+}} xmm6 = xmm5[1,1,3,3]
9937 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm7[1,1,3,3]
9938 ; SSE2-NEXT: por %xmm6, %xmm5
9939 ; SSE2-NEXT: pand %xmm5, %xmm2
9940 ; SSE2-NEXT: pandn %xmm0, %xmm5
9941 ; SSE2-NEXT: por %xmm2, %xmm5
9945 ; SSE2-NEXT: movdqa %xmm5, %xmm0
9955 ; SSE4-NEXT: movdqa %xmm1, %xmm5
9956 ; SSE4-NEXT: pxor %xmm0, %xmm5
9957 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
9963 ; SSE4-NEXT: movdqa %xmm5, %xmm0
10008 ; SSE2-NEXT: movdqa %xmm3, %xmm5
10009 ; SSE2-NEXT: pxor %xmm7, %xmm5
10010 ; SSE2-NEXT: movdqa %xmm5, %xmm6
10013 ; SSE2-NEXT: pcmpeqd %xmm4, %xmm5
10014 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm5[1,1,3,3]
10024 ; SSE2-NEXT: movdqa %xmm7, %xmm5
10025 ; SSE2-NEXT: pcmpgtd %xmm6, %xmm5
10026 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm5[0,0,2,2]
10030 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm5[1,1,3,3]
10031 ; SSE2-NEXT: por %xmm6, %xmm5
10032 ; SSE2-NEXT: pxor %xmm5, %xmm4
10033 ; SSE2-NEXT: pandn %xmm2, %xmm5
10035 ; SSE2-NEXT: por %xmm5, %xmm4
10049 ; SSE4-NEXT: movdqa %xmm3, %xmm5
10050 ; SSE4-NEXT: pxor %xmm0, %xmm5
10051 ; SSE4-NEXT: pcmpgtq %xmm6, %xmm5
10053 ; SSE4-NEXT: pxor %xmm6, %xmm5
10060 ; SSE4-NEXT: movdqa %xmm5, %xmm0
10075 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm5
10077 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
10113 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10116 ; SSE2-NEXT: pand %xmm5, %xmm2
10164 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10167 ; SSE2-NEXT: pand %xmm5, %xmm2
10223 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10226 ; SSE2-NEXT: pand %xmm5, %xmm2
10273 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10276 ; SSE2-NEXT: pand %xmm5, %xmm2
10333 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10336 ; SSE2-NEXT: pand %xmm5, %xmm2
10393 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10396 ; SSE2-NEXT: pand %xmm5, %xmm2
10462 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10465 ; SSE2-NEXT: pand %xmm5, %xmm2
10522 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10525 ; SSE2-NEXT: pand %xmm5, %xmm2
10590 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10593 ; SSE2-NEXT: pand %xmm5, %xmm3
10642 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10645 ; SSE2-NEXT: pand %xmm5, %xmm2
10701 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10704 ; SSE2-NEXT: pand %xmm5, %xmm3
10752 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10755 ; SSE2-NEXT: pand %xmm5, %xmm2
10812 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10815 ; SSE2-NEXT: pand %xmm5, %xmm3
10873 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10876 ; SSE2-NEXT: pand %xmm5, %xmm2
10942 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
10945 ; SSE2-NEXT: pand %xmm5, %xmm3
11003 ; SSE2-NEXT: pshufd {{.*#+}} xmm5 = xmm4[0,0,2,2]
11006 ; SSE2-NEXT: pand %xmm5, %xmm2