Lines Matching refs:xmm11
3288 ; SSE2-NEXT: movdqa %xmm4, %xmm11
3289 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm11
3290 ; SSE2-NEXT: pand %xmm11, %xmm0
3291 ; SSE2-NEXT: pandn %xmm4, %xmm11
3292 ; SSE2-NEXT: por %xmm11, %xmm0
3360 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3361 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
3362 ; SSE2-NEXT: pxor %xmm11, %xmm13
3363 ; SSE2-NEXT: pandn %xmm0, %xmm11
3365 ; SSE2-NEXT: por %xmm13, %xmm11
3375 ; SSE2-NEXT: movdqa %xmm11, %xmm0
3426 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3427 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
3428 ; SSE2-NEXT: pand %xmm11, %xmm0
3429 ; SSE2-NEXT: pandn %xmm4, %xmm11
3430 ; SSE2-NEXT: por %xmm0, %xmm11
3440 ; SSE2-NEXT: movdqa %xmm11, %xmm0
3500 ; SSE2-NEXT: movdqa %xmm14, %xmm11
3501 ; SSE2-NEXT: pxor %xmm0, %xmm11
3509 ; SSE2-NEXT: pandn %xmm5, %xmm11
3510 ; SSE2-NEXT: por %xmm14, %xmm11
3517 ; SSE2-NEXT: movdqa %xmm11, %xmm1
3879 ; SSE2-NEXT: movdqa %xmm2, %xmm11
3880 ; SSE2-NEXT: pxor %xmm10, %xmm11
3883 ; SSE2-NEXT: pcmpgtw %xmm11, %xmm9
3884 ; SSE2-NEXT: movdqa %xmm1, %xmm11
3885 ; SSE2-NEXT: pxor %xmm10, %xmm11
3888 ; SSE2-NEXT: pcmpgtw %xmm11, %xmm12
3889 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3890 ; SSE2-NEXT: pxor %xmm10, %xmm11
3892 ; SSE2-NEXT: pcmpgtw %xmm11, %xmm10
3958 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3959 ; SSE2-NEXT: psubusw %xmm4, %xmm11
3960 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
3961 ; SSE2-NEXT: pand %xmm11, %xmm0
3962 ; SSE2-NEXT: pandn %xmm4, %xmm11
3963 ; SSE2-NEXT: por %xmm0, %xmm11
3973 ; SSE2-NEXT: movdqa %xmm11, %xmm0
4017 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [32768,32768,32768,32768,32768,32768,32768,32768]
4019 ; SSE2-NEXT: pxor %xmm11, %xmm9
4021 ; SSE2-NEXT: pxor %xmm11, %xmm8
4024 ; SSE2-NEXT: pxor %xmm11, %xmm10
4026 ; SSE2-NEXT: pxor %xmm11, %xmm9
4029 ; SSE2-NEXT: pxor %xmm11, %xmm12
4031 ; SSE2-NEXT: pxor %xmm11, %xmm10
4034 ; SSE2-NEXT: pxor %xmm11, %xmm12
4035 ; SSE2-NEXT: pxor %xmm0, %xmm11
4036 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm11
4037 ; SSE2-NEXT: pand %xmm11, %xmm0
4038 ; SSE2-NEXT: pandn %xmm4, %xmm11
4039 ; SSE2-NEXT: por %xmm11, %xmm0
4102 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4103 ; SSE2-NEXT: psubusw %xmm1, %xmm11
4104 ; SSE2-NEXT: pcmpeqw %xmm9, %xmm11
4111 ; SSE2-NEXT: pand %xmm11, %xmm1
4112 ; SSE2-NEXT: pandn %xmm5, %xmm11
4113 ; SSE2-NEXT: por %xmm11, %xmm1
4169 ; SSE2-NEXT: movdqa %xmm4, %xmm11
4170 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm11
4171 ; SSE2-NEXT: pand %xmm11, %xmm0
4172 ; SSE2-NEXT: pandn %xmm4, %xmm11
4173 ; SSE2-NEXT: por %xmm11, %xmm0
4241 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4242 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
4243 ; SSE2-NEXT: pxor %xmm11, %xmm13
4244 ; SSE2-NEXT: pandn %xmm0, %xmm11
4246 ; SSE2-NEXT: por %xmm13, %xmm11
4256 ; SSE2-NEXT: movdqa %xmm11, %xmm0
4307 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4308 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
4309 ; SSE2-NEXT: pand %xmm11, %xmm0
4310 ; SSE2-NEXT: pandn %xmm4, %xmm11
4311 ; SSE2-NEXT: por %xmm0, %xmm11
4321 ; SSE2-NEXT: movdqa %xmm11, %xmm0
4381 ; SSE2-NEXT: movdqa %xmm14, %xmm11
4382 ; SSE2-NEXT: pxor %xmm0, %xmm11
4390 ; SSE2-NEXT: pandn %xmm5, %xmm11
4391 ; SSE2-NEXT: por %xmm14, %xmm11
4398 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4448 ; SSE2-NEXT: movdqa %xmm2, %xmm11
4449 ; SSE2-NEXT: pxor %xmm10, %xmm11
4452 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm9
4453 ; SSE2-NEXT: movdqa %xmm1, %xmm11
4454 ; SSE2-NEXT: pxor %xmm10, %xmm11
4457 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm12
4458 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4459 ; SSE2-NEXT: pxor %xmm10, %xmm11
4461 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm10
4534 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4535 ; SSE2-NEXT: pxor %xmm14, %xmm11
4538 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
4539 ; SSE2-NEXT: movdqa %xmm4, %xmm11
4540 ; SSE2-NEXT: pxor %xmm14, %xmm11
4542 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4543 ; SSE2-NEXT: movdqa %xmm15, %xmm11
4544 ; SSE2-NEXT: pxor %xmm0, %xmm11
4550 ; SSE2-NEXT: pandn %xmm5, %xmm11
4551 ; SSE2-NEXT: por %xmm15, %xmm11
4558 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4604 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,2147483648,2147483648,2147483648]
4606 ; SSE2-NEXT: pxor %xmm11, %xmm9
4608 ; SSE2-NEXT: pxor %xmm11, %xmm8
4611 ; SSE2-NEXT: pxor %xmm11, %xmm10
4613 ; SSE2-NEXT: pxor %xmm11, %xmm9
4616 ; SSE2-NEXT: pxor %xmm11, %xmm12
4618 ; SSE2-NEXT: pxor %xmm11, %xmm10
4621 ; SSE2-NEXT: pxor %xmm11, %xmm12
4622 ; SSE2-NEXT: pxor %xmm0, %xmm11
4623 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm11
4624 ; SSE2-NEXT: pand %xmm11, %xmm0
4625 ; SSE2-NEXT: pandn %xmm4, %xmm11
4626 ; SSE2-NEXT: por %xmm11, %xmm0
4699 ; SSE2-NEXT: movdqa %xmm1, %xmm11
4700 ; SSE2-NEXT: pxor %xmm14, %xmm11
4703 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
4704 ; SSE2-NEXT: movdqa %xmm10, %xmm11
4705 ; SSE2-NEXT: pxor %xmm14, %xmm11
4707 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4708 ; SSE2-NEXT: movdqa %xmm15, %xmm11
4709 ; SSE2-NEXT: pxor %xmm0, %xmm11
4715 ; SSE2-NEXT: pandn %xmm5, %xmm11
4716 ; SSE2-NEXT: por %xmm15, %xmm11
4723 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4774 ; SSE2-NEXT: movdqa %xmm10, %xmm11
4775 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
4776 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
4780 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
4784 ; SSE2-NEXT: movdqa %xmm6, %xmm11
4785 ; SSE2-NEXT: pxor %xmm9, %xmm11
4786 ; SSE2-NEXT: movdqa %xmm11, %xmm12
4789 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
4790 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
4791 ; SSE2-NEXT: pand %xmm13, %xmm11
4793 ; SSE2-NEXT: por %xmm11, %xmm10
4794 ; SSE2-NEXT: movdqa %xmm1, %xmm11
4795 ; SSE2-NEXT: pxor %xmm9, %xmm11
4799 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
4801 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
4802 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
4803 ; SSE2-NEXT: pand %xmm14, %xmm11
4805 ; SSE2-NEXT: por %xmm11, %xmm12
4806 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4807 ; SSE2-NEXT: pxor %xmm9, %xmm11
4810 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
4812 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
4815 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
4816 ; SSE2-NEXT: por %xmm9, %xmm11
4817 ; SSE2-NEXT: pand %xmm11, %xmm0
4818 ; SSE2-NEXT: pandn %xmm4, %xmm11
4819 ; SSE2-NEXT: por %xmm11, %xmm0
4838 ; SSE4-NEXT: movdqa %xmm5, %xmm11
4839 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
4843 ; SSE4-NEXT: movdqa %xmm11, %xmm0
4902 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4903 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
4904 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
4908 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
4913 ; SSE2-NEXT: movdqa %xmm6, %xmm11
4914 ; SSE2-NEXT: pxor %xmm10, %xmm11
4918 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4920 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
4921 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
4922 ; SSE2-NEXT: pand %xmm15, %xmm11
4924 ; SSE2-NEXT: por %xmm11, %xmm13
4925 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4926 ; SSE2-NEXT: pxor %xmm10, %xmm11
4930 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
4931 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
4932 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
4934 ; SSE2-NEXT: pand %xmm11, %xmm14
4937 ; SSE2-NEXT: movdqa %xmm4, %xmm11
4938 ; SSE2-NEXT: pxor %xmm10, %xmm11
4941 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4942 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
4943 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
4945 ; SSE2-NEXT: pand %xmm11, %xmm0
4950 ; SSE2-NEXT: movdqa %xmm15, %xmm11
4951 ; SSE2-NEXT: pxor %xmm1, %xmm11
4957 ; SSE2-NEXT: pandn %xmm5, %xmm11
4958 ; SSE2-NEXT: por %xmm15, %xmm11
4966 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4981 ; SSE4-NEXT: movdqa %xmm1, %xmm11
4982 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
4983 ; SSE4-NEXT: pxor %xmm12, %xmm11
4987 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5049 ; SSE2-NEXT: movdqa %xmm10, %xmm11
5050 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5051 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5055 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
5059 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5060 ; SSE2-NEXT: pxor %xmm9, %xmm11
5061 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5064 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
5065 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
5066 ; SSE2-NEXT: pand %xmm13, %xmm11
5068 ; SSE2-NEXT: por %xmm11, %xmm10
5069 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5070 ; SSE2-NEXT: pxor %xmm9, %xmm11
5074 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5076 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5077 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5078 ; SSE2-NEXT: pand %xmm14, %xmm11
5080 ; SSE2-NEXT: por %xmm11, %xmm12
5081 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5082 ; SSE2-NEXT: pxor %xmm9, %xmm11
5085 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5087 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
5090 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5091 ; SSE2-NEXT: por %xmm9, %xmm11
5092 ; SSE2-NEXT: pand %xmm11, %xmm0
5093 ; SSE2-NEXT: pandn %xmm4, %xmm11
5094 ; SSE2-NEXT: por %xmm11, %xmm0
5113 ; SSE4-NEXT: movdqa %xmm1, %xmm11
5114 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
5117 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5166 ; SSE2-NEXT: movdqa %xmm7, %xmm11
5167 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
5175 ; SSE2-NEXT: movdqa %xmm11, %xmm0
5177 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5178 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5179 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5183 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5188 ; SSE2-NEXT: movdqa %xmm3, %xmm11
5189 ; SSE2-NEXT: pxor %xmm10, %xmm11
5193 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5195 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
5196 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5197 ; SSE2-NEXT: pand %xmm15, %xmm11
5199 ; SSE2-NEXT: por %xmm11, %xmm13
5200 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5201 ; SSE2-NEXT: pxor %xmm10, %xmm11
5205 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
5206 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
5207 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
5209 ; SSE2-NEXT: pand %xmm11, %xmm14
5212 ; SSE2-NEXT: movdqa %xmm9, %xmm11
5213 ; SSE2-NEXT: pxor %xmm10, %xmm11
5216 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5217 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
5218 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
5220 ; SSE2-NEXT: pand %xmm11, %xmm0
5225 ; SSE2-NEXT: movdqa %xmm15, %xmm11
5226 ; SSE2-NEXT: pxor %xmm1, %xmm11
5232 ; SSE2-NEXT: pandn %xmm5, %xmm11
5233 ; SSE2-NEXT: por %xmm15, %xmm11
5241 ; SSE2-NEXT: movdqa %xmm11, %xmm1
5256 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5257 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
5258 ; SSE4-NEXT: pxor %xmm0, %xmm11
5263 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5325 ; SSE2-NEXT: movdqa %xmm10, %xmm11
5326 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5327 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5331 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
5335 ; SSE2-NEXT: movdqa %xmm6, %xmm11
5336 ; SSE2-NEXT: pxor %xmm9, %xmm11
5337 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5340 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
5341 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
5342 ; SSE2-NEXT: pand %xmm13, %xmm11
5344 ; SSE2-NEXT: por %xmm11, %xmm10
5345 ; SSE2-NEXT: movdqa %xmm1, %xmm11
5346 ; SSE2-NEXT: pxor %xmm9, %xmm11
5350 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5352 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5353 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5354 ; SSE2-NEXT: pand %xmm14, %xmm11
5356 ; SSE2-NEXT: por %xmm11, %xmm12
5357 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5358 ; SSE2-NEXT: pxor %xmm9, %xmm11
5361 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5363 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
5366 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5367 ; SSE2-NEXT: por %xmm9, %xmm11
5368 ; SSE2-NEXT: pand %xmm11, %xmm0
5369 ; SSE2-NEXT: pandn %xmm4, %xmm11
5370 ; SSE2-NEXT: por %xmm11, %xmm0
5391 ; SSE4-NEXT: movdqa %xmm2, %xmm11
5392 ; SSE4-NEXT: pxor %xmm0, %xmm11
5395 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5398 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5399 ; SSE4-NEXT: pxor %xmm0, %xmm11
5400 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
5406 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5479 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5480 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5481 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5485 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5490 ; SSE2-NEXT: movdqa %xmm6, %xmm11
5491 ; SSE2-NEXT: pxor %xmm10, %xmm11
5495 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5497 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
5498 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5499 ; SSE2-NEXT: pand %xmm15, %xmm11
5501 ; SSE2-NEXT: por %xmm11, %xmm13
5502 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5503 ; SSE2-NEXT: pxor %xmm10, %xmm11
5507 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
5508 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
5509 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
5511 ; SSE2-NEXT: pand %xmm11, %xmm14
5514 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5515 ; SSE2-NEXT: pxor %xmm10, %xmm11
5518 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5519 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
5520 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
5522 ; SSE2-NEXT: pand %xmm11, %xmm0
5527 ; SSE2-NEXT: movdqa %xmm15, %xmm11
5528 ; SSE2-NEXT: pxor %xmm1, %xmm11
5534 ; SSE2-NEXT: pandn %xmm5, %xmm11
5535 ; SSE2-NEXT: por %xmm15, %xmm11
5543 ; SSE2-NEXT: movdqa %xmm11, %xmm1
5559 ; SSE4-NEXT: movdqa %xmm6, %xmm11
5560 ; SSE4-NEXT: pxor %xmm0, %xmm11
5563 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5567 ; SSE4-NEXT: movdqa %xmm1, %xmm11
5568 ; SSE4-NEXT: pxor %xmm0, %xmm11
5569 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
5570 ; SSE4-NEXT: pxor %xmm12, %xmm11
5577 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5653 ; SSE2-NEXT: movdqa %xmm10, %xmm11
5654 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5655 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5659 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
5663 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5664 ; SSE2-NEXT: pxor %xmm9, %xmm11
5665 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5668 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
5669 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
5670 ; SSE2-NEXT: pand %xmm13, %xmm11
5672 ; SSE2-NEXT: por %xmm11, %xmm10
5673 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5674 ; SSE2-NEXT: pxor %xmm9, %xmm11
5678 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5680 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5681 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5682 ; SSE2-NEXT: pand %xmm14, %xmm11
5684 ; SSE2-NEXT: por %xmm11, %xmm12
5685 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5686 ; SSE2-NEXT: pxor %xmm9, %xmm11
5689 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5691 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
5694 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5695 ; SSE2-NEXT: por %xmm9, %xmm11
5696 ; SSE2-NEXT: pand %xmm11, %xmm0
5697 ; SSE2-NEXT: pandn %xmm4, %xmm11
5698 ; SSE2-NEXT: por %xmm11, %xmm0
5719 ; SSE4-NEXT: movdqa %xmm6, %xmm11
5720 ; SSE4-NEXT: pxor %xmm0, %xmm11
5723 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5726 ; SSE4-NEXT: movdqa %xmm1, %xmm11
5727 ; SSE4-NEXT: pxor %xmm0, %xmm11
5728 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
5734 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5797 ; SSE2-NEXT: movdqa %xmm7, %xmm11
5798 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
5806 ; SSE2-NEXT: movdqa %xmm11, %xmm0
5808 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5809 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5810 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5814 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5819 ; SSE2-NEXT: movdqa %xmm3, %xmm11
5820 ; SSE2-NEXT: pxor %xmm10, %xmm11
5824 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5826 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
5827 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5828 ; SSE2-NEXT: pand %xmm15, %xmm11
5830 ; SSE2-NEXT: por %xmm11, %xmm13
5831 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5832 ; SSE2-NEXT: pxor %xmm10, %xmm11
5836 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
5837 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
5838 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
5840 ; SSE2-NEXT: pand %xmm11, %xmm14
5843 ; SSE2-NEXT: movdqa %xmm9, %xmm11
5844 ; SSE2-NEXT: pxor %xmm10, %xmm11
5847 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5848 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
5849 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
5851 ; SSE2-NEXT: pand %xmm11, %xmm0
5856 ; SSE2-NEXT: movdqa %xmm15, %xmm11
5857 ; SSE2-NEXT: pxor %xmm1, %xmm11
5863 ; SSE2-NEXT: pandn %xmm5, %xmm11
5864 ; SSE2-NEXT: por %xmm15, %xmm11
5872 ; SSE2-NEXT: movdqa %xmm11, %xmm1
5888 ; SSE4-NEXT: movdqa %xmm2, %xmm11
5889 ; SSE4-NEXT: pxor %xmm0, %xmm11
5892 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5896 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5897 ; SSE4-NEXT: pxor %xmm0, %xmm11
5898 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
5899 ; SSE4-NEXT: pxor %xmm12, %xmm11
5906 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5984 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5985 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm11
5986 ; SSE2-NEXT: pand %xmm11, %xmm4
5987 ; SSE2-NEXT: pandn %xmm0, %xmm11
5988 ; SSE2-NEXT: por %xmm4, %xmm11
5998 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6058 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6059 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
6060 ; SSE2-NEXT: pxor %xmm11, %xmm13
6061 ; SSE2-NEXT: pandn %xmm4, %xmm11
6063 ; SSE2-NEXT: por %xmm13, %xmm11
6073 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6125 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6126 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
6127 ; SSE2-NEXT: pand %xmm11, %xmm4
6128 ; SSE2-NEXT: pandn %xmm0, %xmm11
6129 ; SSE2-NEXT: por %xmm4, %xmm11
6139 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6198 ; SSE2-NEXT: movdqa %xmm14, %xmm11
6199 ; SSE2-NEXT: pxor %xmm0, %xmm11
6207 ; SSE2-NEXT: pandn %xmm1, %xmm11
6208 ; SSE2-NEXT: por %xmm14, %xmm11
6215 ; SSE2-NEXT: movdqa %xmm11, %xmm1
6572 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6589 ; SSE2-NEXT: movdqa %xmm11, %xmm12
6594 ; SSE2-NEXT: pandn %xmm11, %xmm0
6661 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6662 ; SSE2-NEXT: psubusw %xmm4, %xmm11
6663 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
6664 ; SSE2-NEXT: pand %xmm11, %xmm4
6665 ; SSE2-NEXT: pandn %xmm0, %xmm11
6666 ; SSE2-NEXT: por %xmm4, %xmm11
6676 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6720 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6739 ; SSE2-NEXT: pxor %xmm11, %xmm0
6742 ; SSE2-NEXT: pandn %xmm11, %xmm0
6812 ; SSE2-NEXT: movdqa %xmm4, %xmm11
6813 ; SSE2-NEXT: psubusw %xmm0, %xmm11
6814 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
6815 ; SSE2-NEXT: pand %xmm11, %xmm4
6816 ; SSE2-NEXT: pandn %xmm0, %xmm11
6817 ; SSE2-NEXT: por %xmm4, %xmm11
6827 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6878 ; SSE2-NEXT: movdqa %xmm4, %xmm11
6879 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm11
6880 ; SSE2-NEXT: pand %xmm11, %xmm4
6881 ; SSE2-NEXT: pandn %xmm0, %xmm11
6882 ; SSE2-NEXT: por %xmm4, %xmm11
6892 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6952 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6953 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
6954 ; SSE2-NEXT: pxor %xmm11, %xmm13
6955 ; SSE2-NEXT: pandn %xmm4, %xmm11
6957 ; SSE2-NEXT: por %xmm13, %xmm11
6967 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7019 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7020 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
7021 ; SSE2-NEXT: pand %xmm11, %xmm4
7022 ; SSE2-NEXT: pandn %xmm0, %xmm11
7023 ; SSE2-NEXT: por %xmm4, %xmm11
7033 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7092 ; SSE2-NEXT: movdqa %xmm14, %xmm11
7093 ; SSE2-NEXT: pxor %xmm0, %xmm11
7101 ; SSE2-NEXT: pandn %xmm1, %xmm11
7102 ; SSE2-NEXT: por %xmm14, %xmm11
7109 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7154 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7171 ; SSE2-NEXT: movdqa %xmm11, %xmm12
7176 ; SSE2-NEXT: pandn %xmm11, %xmm0
7250 ; SSE2-NEXT: movdqa %xmm5, %xmm11
7251 ; SSE2-NEXT: pxor %xmm14, %xmm11
7254 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7255 ; SSE2-NEXT: movdqa %xmm4, %xmm11
7256 ; SSE2-NEXT: pxor %xmm14, %xmm11
7258 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7259 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7260 ; SSE2-NEXT: pxor %xmm0, %xmm11
7266 ; SSE2-NEXT: pandn %xmm1, %xmm11
7267 ; SSE2-NEXT: por %xmm15, %xmm11
7274 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7320 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7339 ; SSE2-NEXT: pxor %xmm11, %xmm0
7342 ; SSE2-NEXT: pandn %xmm11, %xmm0
7416 ; SSE2-NEXT: movdqa %xmm1, %xmm11
7417 ; SSE2-NEXT: pxor %xmm14, %xmm11
7420 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7421 ; SSE2-NEXT: movdqa %xmm10, %xmm11
7422 ; SSE2-NEXT: pxor %xmm14, %xmm11
7424 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7425 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7426 ; SSE2-NEXT: pxor %xmm0, %xmm11
7432 ; SSE2-NEXT: pandn %xmm1, %xmm11
7433 ; SSE2-NEXT: por %xmm15, %xmm11
7440 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7488 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,0,2147483648,0]
7490 ; SSE2-NEXT: pxor %xmm11, %xmm8
7492 ; SSE2-NEXT: pxor %xmm11, %xmm9
7502 ; SSE2-NEXT: pxor %xmm11, %xmm9
7504 ; SSE2-NEXT: pxor %xmm11, %xmm10
7514 ; SSE2-NEXT: pxor %xmm11, %xmm10
7516 ; SSE2-NEXT: pxor %xmm11, %xmm12
7526 ; SSE2-NEXT: pxor %xmm11, %xmm12
7527 ; SSE2-NEXT: pxor %xmm4, %xmm11
7528 ; SSE2-NEXT: movdqa %xmm11, %xmm13
7531 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
7532 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7534 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7535 ; SSE2-NEXT: por %xmm12, %xmm11
7536 ; SSE2-NEXT: pand %xmm11, %xmm4
7537 ; SSE2-NEXT: pandn %xmm0, %xmm11
7538 ; SSE2-NEXT: por %xmm4, %xmm11
7548 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7561 ; SSE4-NEXT: movdqa %xmm5, %xmm11
7562 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
7566 ; SSE4-NEXT: movdqa %xmm11, %xmm0
7622 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7623 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
7624 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
7628 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7633 ; SSE2-NEXT: movdqa %xmm6, %xmm11
7634 ; SSE2-NEXT: pxor %xmm10, %xmm11
7638 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7640 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
7641 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7642 ; SSE2-NEXT: pand %xmm15, %xmm11
7644 ; SSE2-NEXT: por %xmm11, %xmm13
7645 ; SSE2-NEXT: movdqa %xmm5, %xmm11
7646 ; SSE2-NEXT: pxor %xmm10, %xmm11
7650 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7651 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
7652 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
7654 ; SSE2-NEXT: pand %xmm11, %xmm14
7657 ; SSE2-NEXT: movdqa %xmm4, %xmm11
7658 ; SSE2-NEXT: pxor %xmm10, %xmm11
7661 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7662 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
7663 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
7665 ; SSE2-NEXT: pand %xmm11, %xmm0
7670 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7671 ; SSE2-NEXT: pxor %xmm1, %xmm11
7677 ; SSE2-NEXT: pandn %xmm2, %xmm11
7678 ; SSE2-NEXT: por %xmm15, %xmm11
7686 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7701 ; SSE4-NEXT: movdqa %xmm1, %xmm11
7702 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
7703 ; SSE4-NEXT: pxor %xmm12, %xmm11
7707 ; SSE4-NEXT: movdqa %xmm11, %xmm0
7761 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,0,2147483648,0]
7763 ; SSE2-NEXT: pxor %xmm11, %xmm8
7765 ; SSE2-NEXT: pxor %xmm11, %xmm9
7775 ; SSE2-NEXT: pxor %xmm11, %xmm9
7777 ; SSE2-NEXT: pxor %xmm11, %xmm10
7787 ; SSE2-NEXT: pxor %xmm11, %xmm10
7789 ; SSE2-NEXT: pxor %xmm11, %xmm12
7799 ; SSE2-NEXT: pxor %xmm11, %xmm12
7800 ; SSE2-NEXT: pxor %xmm0, %xmm11
7801 ; SSE2-NEXT: movdqa %xmm11, %xmm13
7804 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
7805 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7807 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7808 ; SSE2-NEXT: por %xmm12, %xmm11
7809 ; SSE2-NEXT: pand %xmm11, %xmm4
7810 ; SSE2-NEXT: pandn %xmm0, %xmm11
7811 ; SSE2-NEXT: por %xmm4, %xmm11
7821 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7834 ; SSE4-NEXT: movdqa %xmm1, %xmm11
7835 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
7838 ; SSE4-NEXT: movdqa %xmm11, %xmm0
7884 ; SSE2-NEXT: movdqa %xmm7, %xmm11
7885 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
7893 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7895 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7896 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
7897 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
7901 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7906 ; SSE2-NEXT: movdqa %xmm3, %xmm11
7907 ; SSE2-NEXT: pxor %xmm10, %xmm11
7911 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7913 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
7914 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7915 ; SSE2-NEXT: pand %xmm15, %xmm11
7917 ; SSE2-NEXT: por %xmm11, %xmm13
7918 ; SSE2-NEXT: movdqa %xmm2, %xmm11
7919 ; SSE2-NEXT: pxor %xmm10, %xmm11
7923 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7924 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
7925 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
7927 ; SSE2-NEXT: pand %xmm11, %xmm14
7930 ; SSE2-NEXT: movdqa %xmm9, %xmm11
7931 ; SSE2-NEXT: pxor %xmm10, %xmm11
7934 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7935 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
7936 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
7938 ; SSE2-NEXT: pand %xmm11, %xmm0
7943 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7944 ; SSE2-NEXT: pxor %xmm1, %xmm11
7950 ; SSE2-NEXT: pandn %xmm2, %xmm11
7951 ; SSE2-NEXT: por %xmm15, %xmm11
7959 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7974 ; SSE4-NEXT: movdqa %xmm5, %xmm11
7975 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
7976 ; SSE4-NEXT: pxor %xmm0, %xmm11
7981 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8035 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,2147483648,2147483648,2147483648]
8037 ; SSE2-NEXT: pxor %xmm11, %xmm8
8039 ; SSE2-NEXT: pxor %xmm11, %xmm9
8049 ; SSE2-NEXT: pxor %xmm11, %xmm9
8051 ; SSE2-NEXT: pxor %xmm11, %xmm10
8061 ; SSE2-NEXT: pxor %xmm11, %xmm10
8063 ; SSE2-NEXT: pxor %xmm11, %xmm12
8073 ; SSE2-NEXT: pxor %xmm11, %xmm12
8074 ; SSE2-NEXT: pxor %xmm4, %xmm11
8075 ; SSE2-NEXT: movdqa %xmm11, %xmm13
8078 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
8079 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8081 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8082 ; SSE2-NEXT: por %xmm12, %xmm11
8083 ; SSE2-NEXT: pand %xmm11, %xmm4
8084 ; SSE2-NEXT: pandn %xmm0, %xmm11
8085 ; SSE2-NEXT: por %xmm4, %xmm11
8095 ; SSE2-NEXT: movdqa %xmm11, %xmm0
8110 ; SSE4-NEXT: movdqa %xmm2, %xmm11
8111 ; SSE4-NEXT: pxor %xmm0, %xmm11
8114 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8117 ; SSE4-NEXT: movdqa %xmm5, %xmm11
8118 ; SSE4-NEXT: pxor %xmm0, %xmm11
8119 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
8125 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8195 ; SSE2-NEXT: movdqa %xmm0, %xmm11
8196 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
8197 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
8201 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8206 ; SSE2-NEXT: movdqa %xmm6, %xmm11
8207 ; SSE2-NEXT: pxor %xmm10, %xmm11
8211 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8213 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
8214 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8215 ; SSE2-NEXT: pand %xmm15, %xmm11
8217 ; SSE2-NEXT: por %xmm11, %xmm13
8218 ; SSE2-NEXT: movdqa %xmm5, %xmm11
8219 ; SSE2-NEXT: pxor %xmm10, %xmm11
8223 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
8224 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
8225 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
8227 ; SSE2-NEXT: pand %xmm11, %xmm14
8230 ; SSE2-NEXT: movdqa %xmm4, %xmm11
8231 ; SSE2-NEXT: pxor %xmm10, %xmm11
8234 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8235 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
8236 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
8238 ; SSE2-NEXT: pand %xmm11, %xmm0
8243 ; SSE2-NEXT: movdqa %xmm15, %xmm11
8244 ; SSE2-NEXT: pxor %xmm1, %xmm11
8250 ; SSE2-NEXT: pandn %xmm2, %xmm11
8251 ; SSE2-NEXT: por %xmm15, %xmm11
8259 ; SSE2-NEXT: movdqa %xmm11, %xmm1
8275 ; SSE4-NEXT: movdqa %xmm6, %xmm11
8276 ; SSE4-NEXT: pxor %xmm0, %xmm11
8279 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8283 ; SSE4-NEXT: movdqa %xmm1, %xmm11
8284 ; SSE4-NEXT: pxor %xmm0, %xmm11
8285 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
8286 ; SSE4-NEXT: pxor %xmm12, %xmm11
8293 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8361 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,2147483648,2147483648,2147483648]
8363 ; SSE2-NEXT: pxor %xmm11, %xmm8
8365 ; SSE2-NEXT: pxor %xmm11, %xmm9
8375 ; SSE2-NEXT: pxor %xmm11, %xmm9
8377 ; SSE2-NEXT: pxor %xmm11, %xmm10
8387 ; SSE2-NEXT: pxor %xmm11, %xmm10
8389 ; SSE2-NEXT: pxor %xmm11, %xmm12
8399 ; SSE2-NEXT: pxor %xmm11, %xmm12
8400 ; SSE2-NEXT: pxor %xmm0, %xmm11
8401 ; SSE2-NEXT: movdqa %xmm11, %xmm13
8404 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
8405 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8407 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8408 ; SSE2-NEXT: por %xmm12, %xmm11
8409 ; SSE2-NEXT: pand %xmm11, %xmm4
8410 ; SSE2-NEXT: pandn %xmm0, %xmm11
8411 ; SSE2-NEXT: por %xmm4, %xmm11
8421 ; SSE2-NEXT: movdqa %xmm11, %xmm0
8436 ; SSE4-NEXT: movdqa %xmm6, %xmm11
8437 ; SSE4-NEXT: pxor %xmm0, %xmm11
8440 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8443 ; SSE4-NEXT: movdqa %xmm1, %xmm11
8444 ; SSE4-NEXT: pxor %xmm0, %xmm11
8445 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
8451 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8511 ; SSE2-NEXT: movdqa %xmm7, %xmm11
8512 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
8520 ; SSE2-NEXT: movdqa %xmm11, %xmm0
8522 ; SSE2-NEXT: movdqa %xmm0, %xmm11
8523 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
8524 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
8528 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8533 ; SSE2-NEXT: movdqa %xmm3, %xmm11
8534 ; SSE2-NEXT: pxor %xmm10, %xmm11
8538 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8540 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
8541 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8542 ; SSE2-NEXT: pand %xmm15, %xmm11
8544 ; SSE2-NEXT: por %xmm11, %xmm13
8545 ; SSE2-NEXT: movdqa %xmm2, %xmm11
8546 ; SSE2-NEXT: pxor %xmm10, %xmm11
8550 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
8551 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
8552 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
8554 ; SSE2-NEXT: pand %xmm11, %xmm14
8557 ; SSE2-NEXT: movdqa %xmm9, %xmm11
8558 ; SSE2-NEXT: pxor %xmm10, %xmm11
8561 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8562 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
8563 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
8565 ; SSE2-NEXT: pand %xmm11, %xmm0
8570 ; SSE2-NEXT: movdqa %xmm15, %xmm11
8571 ; SSE2-NEXT: pxor %xmm1, %xmm11
8577 ; SSE2-NEXT: pandn %xmm2, %xmm11
8578 ; SSE2-NEXT: por %xmm15, %xmm11
8586 ; SSE2-NEXT: movdqa %xmm11, %xmm1
8602 ; SSE4-NEXT: movdqa %xmm2, %xmm11
8603 ; SSE4-NEXT: pxor %xmm0, %xmm11
8606 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8610 ; SSE4-NEXT: movdqa %xmm5, %xmm11
8611 ; SSE4-NEXT: pxor %xmm0, %xmm11
8612 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
8613 ; SSE4-NEXT: pxor %xmm12, %xmm11
8620 ; SSE4-NEXT: movdqa %xmm11, %xmm0