Lines Matching refs:xmm4
23 ; SSE2-NEXT: movdqa %xmm2, %xmm4
24 ; SSE2-NEXT: psrlq %xmm3, %xmm4
26 ; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm2[0],xmm4[1]
31 ; SSE2-NEXT: xorpd %xmm4, %xmm2
32 ; SSE2-NEXT: psubq %xmm4, %xmm2
41 ; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm1[2,3,0,1]
42 ; SSE41-NEXT: psrlq %xmm4, %xmm2
46 ; SSE41-NEXT: psrlq %xmm4, %xmm0
56 ; AVX1-NEXT: vpshufd {{.*#+}} xmm4 = xmm1[2,3,0,1]
57 ; AVX1-NEXT: vpsrlq %xmm4, %xmm2, %xmm2
60 ; AVX1-NEXT: vpsrlq %xmm4, %xmm0, %xmm0
95 ; X32-SSE-NEXT: movdqa %xmm3, %xmm4
96 ; X32-SSE-NEXT: psrlq %xmm2, %xmm4
99 ; X32-SSE-NEXT: movsd {{.*#+}} xmm4 = xmm3[0],xmm4[1]
104 ; X32-SSE-NEXT: xorpd %xmm4, %xmm1
105 ; X32-SSE-NEXT: psubq %xmm4, %xmm1
121 ; SSE2-NEXT: movdqa %xmm0, %xmm4
122 ; SSE2-NEXT: psrad %xmm2, %xmm4
123 ; SSE2-NEXT: movsd {{.*#+}} xmm3 = xmm4[0],xmm3[1]
126 ; SSE2-NEXT: movdqa %xmm1, %xmm4
127 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm4 = xmm4[2],xmm3[2],xmm4[3],xmm3[3]
129 ; SSE2-NEXT: psrad %xmm4, %xmm5
145 ; SSE41-NEXT: movdqa %xmm0, %xmm4
146 ; SSE41-NEXT: psrad %xmm2, %xmm4
147 ; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm4[0,1,2,3],xmm3[4,5,6,7]
155 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm4[2,3],xmm0[4,5],xmm4[6,7]
204 ; X32-SSE-NEXT: movdqa %xmm0, %xmm4
205 ; X32-SSE-NEXT: psrad %xmm2, %xmm4
206 ; X32-SSE-NEXT: movsd {{.*#+}} xmm3 = xmm4[0],xmm3[1]
209 ; X32-SSE-NEXT: movdqa %xmm1, %xmm4
210 ; X32-SSE-NEXT: punpckhdq {{.*#+}} xmm4 = xmm4[2],xmm3[2],xmm4[3],xmm3[3]
212 ; X32-SSE-NEXT: psrad %xmm4, %xmm5
268 ; SSE41-NEXT: movdqa %xmm2, %xmm4
269 ; SSE41-NEXT: psraw $8, %xmm4
271 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
376 … {{.*#+}} xmm4 = xmm4[8],xmm1[8],xmm4[9],xmm1[9],xmm4[10],xmm1[10],xmm4[11],xmm1[11],xmm4[12],xmm1…
379 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
385 ; SSE2-NEXT: paddw %xmm4, %xmm4
387 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
393 ; SSE2-NEXT: paddw %xmm4, %xmm4
395 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
396 ; SSE2-NEXT: movdqa %xmm5, %xmm4
397 ; SSE2-NEXT: pandn %xmm2, %xmm4
400 ; SSE2-NEXT: por %xmm4, %xmm2
404 ; SSE2-NEXT: pxor %xmm4, %xmm4
405 ; SSE2-NEXT: pcmpgtw %xmm1, %xmm4
406 ; SSE2-NEXT: movdqa %xmm4, %xmm5
409 ; SSE2-NEXT: pand %xmm4, %xmm0
412 ; SSE2-NEXT: pxor %xmm4, %xmm4
413 ; SSE2-NEXT: pcmpgtw %xmm1, %xmm4
414 ; SSE2-NEXT: movdqa %xmm4, %xmm5
417 ; SSE2-NEXT: pand %xmm4, %xmm0
436 ; SSE41-NEXT: movdqa %xmm3, %xmm4
437 ; SSE41-NEXT: psraw $4, %xmm4
438 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
439 ; SSE41-NEXT: movdqa %xmm3, %xmm4
440 ; SSE41-NEXT: psraw $2, %xmm4
442 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
443 ; SSE41-NEXT: movdqa %xmm3, %xmm4
444 ; SSE41-NEXT: psraw $1, %xmm4
446 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
471 ; AVX-NEXT: vpsraw $4, %xmm3, %xmm4
472 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
473 ; AVX-NEXT: vpsraw $2, %xmm3, %xmm4
475 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
476 ; AVX-NEXT: vpsraw $1, %xmm3, %xmm4
478 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
506 ; AVX512-NEXT: vpsraw $4, %xmm3, %xmm4
507 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
508 ; AVX512-NEXT: vpsraw $2, %xmm3, %xmm4
510 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
511 ; AVX512-NEXT: vpsraw $1, %xmm3, %xmm4
513 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
533 … {{.*#+}} xmm4 = xmm4[8],xmm1[8],xmm4[9],xmm1[9],xmm4[10],xmm1[10],xmm4[11],xmm1[11],xmm4[12],xmm1…
536 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
542 ; X32-SSE-NEXT: paddw %xmm4, %xmm4
544 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
550 ; X32-SSE-NEXT: paddw %xmm4, %xmm4
552 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
553 ; X32-SSE-NEXT: movdqa %xmm5, %xmm4
554 ; X32-SSE-NEXT: pandn %xmm2, %xmm4
557 ; X32-SSE-NEXT: por %xmm4, %xmm2
561 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
562 ; X32-SSE-NEXT: pcmpgtw %xmm1, %xmm4
563 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
566 ; X32-SSE-NEXT: pand %xmm4, %xmm0
569 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
570 ; X32-SSE-NEXT: pcmpgtw %xmm1, %xmm4
571 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
574 ; X32-SSE-NEXT: pand %xmm4, %xmm0
756 … {{.*#+}} xmm4 = xmm4[8],xmm3[8],xmm4[9],xmm3[9],xmm4[10],xmm3[10],xmm4[11],xmm3[11],xmm4[12],xmm3…
759 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
765 ; SSE2-NEXT: paddw %xmm4, %xmm4
767 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
773 ; SSE2-NEXT: paddw %xmm4, %xmm4
775 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
776 ; SSE2-NEXT: movdqa %xmm5, %xmm4
777 ; SSE2-NEXT: pandn %xmm1, %xmm4
780 ; SSE2-NEXT: por %xmm4, %xmm1
784 ; SSE2-NEXT: pxor %xmm4, %xmm4
785 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm4
786 ; SSE2-NEXT: movdqa %xmm4, %xmm5
789 ; SSE2-NEXT: pand %xmm4, %xmm0
792 ; SSE2-NEXT: pxor %xmm4, %xmm4
793 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm4
794 ; SSE2-NEXT: movdqa %xmm4, %xmm5
797 ; SSE2-NEXT: pand %xmm4, %xmm0
818 ; SSE41-NEXT: movdqa %xmm3, %xmm4
819 ; SSE41-NEXT: psraw $4, %xmm4
820 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
821 ; SSE41-NEXT: movdqa %xmm3, %xmm4
822 ; SSE41-NEXT: psraw $2, %xmm4
824 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
825 ; SSE41-NEXT: movdqa %xmm3, %xmm4
826 ; SSE41-NEXT: psraw $1, %xmm4
828 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
855 ; AVX1-NEXT: vpsraw $4, %xmm3, %xmm4
856 ; AVX1-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
857 ; AVX1-NEXT: vpsraw $2, %xmm3, %xmm4
859 ; AVX1-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
860 ; AVX1-NEXT: vpsraw $1, %xmm3, %xmm4
862 ; AVX1-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
884 ; AVX2-NEXT: vpsraw $4, %xmm3, %xmm4
885 ; AVX2-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
886 ; AVX2-NEXT: vpsraw $2, %xmm3, %xmm4
888 ; AVX2-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
889 ; AVX2-NEXT: vpsraw $1, %xmm3, %xmm4
891 ; AVX2-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
929 ; AVX512-NEXT: vpsraw $4, %xmm3, %xmm4
930 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
931 ; AVX512-NEXT: vpsraw $2, %xmm3, %xmm4
933 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
934 ; AVX512-NEXT: vpsraw $1, %xmm3, %xmm4
936 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
959 … {{.*#+}} xmm4 = xmm4[8],xmm3[8],xmm4[9],xmm3[9],xmm4[10],xmm3[10],xmm4[11],xmm3[11],xmm4[12],xmm3…
962 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
968 ; X32-SSE-NEXT: paddw %xmm4, %xmm4
970 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
976 ; X32-SSE-NEXT: paddw %xmm4, %xmm4
978 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
979 ; X32-SSE-NEXT: movdqa %xmm5, %xmm4
980 ; X32-SSE-NEXT: pandn %xmm1, %xmm4
983 ; X32-SSE-NEXT: por %xmm4, %xmm1
987 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
988 ; X32-SSE-NEXT: pcmpgtw %xmm3, %xmm4
989 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
992 ; X32-SSE-NEXT: pand %xmm4, %xmm0
995 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
996 ; X32-SSE-NEXT: pcmpgtw %xmm3, %xmm4
997 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
1000 ; X32-SSE-NEXT: pand %xmm4, %xmm0
1270 … {{.*#+}} xmm4 = xmm4[8],xmm3[8],xmm4[9],xmm3[9],xmm4[10],xmm3[10],xmm4[11],xmm3[11],xmm4[12],xmm3…
1273 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
1279 ; SSE2-NEXT: paddw %xmm4, %xmm4
1281 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
1287 ; SSE2-NEXT: paddw %xmm4, %xmm4
1289 ; SSE2-NEXT: pcmpgtw %xmm4, %xmm5
1290 ; SSE2-NEXT: movdqa %xmm5, %xmm4
1291 ; SSE2-NEXT: pandn %xmm1, %xmm4
1294 ; SSE2-NEXT: por %xmm4, %xmm1
1298 ; SSE2-NEXT: pxor %xmm4, %xmm4
1299 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm4
1300 ; SSE2-NEXT: movdqa %xmm4, %xmm5
1303 ; SSE2-NEXT: pand %xmm4, %xmm0
1306 ; SSE2-NEXT: pxor %xmm4, %xmm4
1307 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm4
1308 ; SSE2-NEXT: movdqa %xmm4, %xmm5
1311 ; SSE2-NEXT: pand %xmm4, %xmm0
1331 ; SSE41-NEXT: movdqa %xmm2, %xmm4
1332 ; SSE41-NEXT: psraw $4, %xmm4
1333 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
1334 ; SSE41-NEXT: movdqa %xmm2, %xmm4
1335 ; SSE41-NEXT: psraw $2, %xmm4
1337 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
1338 ; SSE41-NEXT: movdqa %xmm2, %xmm4
1339 ; SSE41-NEXT: psraw $1, %xmm4
1341 ; SSE41-NEXT: pblendvb %xmm4, %xmm2
1367 ; AVX-NEXT: vpsraw $4, %xmm3, %xmm4
1368 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
1369 ; AVX-NEXT: vpsraw $2, %xmm3, %xmm4
1371 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
1372 ; AVX-NEXT: vpsraw $1, %xmm3, %xmm4
1374 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
1403 ; AVX512-NEXT: vpsraw $4, %xmm3, %xmm4
1404 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
1405 ; AVX512-NEXT: vpsraw $2, %xmm3, %xmm4
1407 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm3
1408 ; AVX512-NEXT: vpsraw $1, %xmm3, %xmm4
1410 ; AVX512-NEXT: vpblendvb %xmm2, %xmm4, %xmm3, %xmm2
1431 … {{.*#+}} xmm4 = xmm4[8],xmm3[8],xmm4[9],xmm3[9],xmm4[10],xmm3[10],xmm4[11],xmm3[11],xmm4[12],xmm3…
1434 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
1440 ; X32-SSE-NEXT: paddw %xmm4, %xmm4
1442 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
1448 ; X32-SSE-NEXT: paddw %xmm4, %xmm4
1450 ; X32-SSE-NEXT: pcmpgtw %xmm4, %xmm5
1451 ; X32-SSE-NEXT: movdqa %xmm5, %xmm4
1452 ; X32-SSE-NEXT: pandn %xmm1, %xmm4
1455 ; X32-SSE-NEXT: por %xmm4, %xmm1
1459 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
1460 ; X32-SSE-NEXT: pcmpgtw %xmm3, %xmm4
1461 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
1464 ; X32-SSE-NEXT: pand %xmm4, %xmm0
1467 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
1468 ; X32-SSE-NEXT: pcmpgtw %xmm3, %xmm4
1469 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
1472 ; X32-SSE-NEXT: pand %xmm4, %xmm0