• Home
  • Raw
  • Download

Lines Matching refs:SSE41

4 …cpu=x86-64 -mattr=+sse4.1 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE41
263 ; SSE41-LABEL: shuffle_v4f32_0022:
264 ; SSE41: # BB#0:
265 ; SSE41-NEXT: movsldup {{.*#+}} xmm0 = xmm0[0,0,2,2]
266 ; SSE41-NEXT: retq
291 ; SSE41-LABEL: shuffle_v4f32_1133:
292 ; SSE41: # BB#0:
293 ; SSE41-NEXT: movshdup {{.*#+}} xmm0 = xmm0[1,1,3,3]
294 ; SSE41-NEXT: retq
323 ; SSE41-LABEL: shuffle_v4i32_0124:
324 ; SSE41: # BB#0:
325 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,2,0]
326 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3,4,5],xmm1[6,7]
327 ; SSE41-NEXT: retq
362 ; SSE41-LABEL: shuffle_v4i32_0142:
363 ; SSE41: # BB#0:
364 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]
365 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,1,2,2]
366 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5],xmm0[6,7]
367 ; SSE41-NEXT: retq
407 ; SSE41-LABEL: shuffle_v4i32_0412:
408 ; SSE41: # BB#0:
409 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,1,1]
410 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,1,1,2]
411 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5,6,7]
412 ; SSE41-NEXT: retq
452 ; SSE41-LABEL: shuffle_v4i32_4012:
453 ; SSE41: # BB#0:
454 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,1,2]
455 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3,4,5,6,7]
456 ; SSE41-NEXT: retq
504 ; SSE41-LABEL: shuffle_v4i32_0451:
505 ; SSE41: # BB#0:
506 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,0,1,1]
507 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,1,0,1]
508 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5],xmm0[6,7]
509 ; SSE41-NEXT: retq
560 ; SSE41-LABEL: shuffle_v4i32_4015:
561 ; SSE41: # BB#0:
562 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm1[0,1,0,1]
563 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
564 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1],xmm0[2,3,4,5],xmm1[6,7]
565 ; SSE41-NEXT: retq
606 ; SSE41-LABEL: shuffle_v4f32_4zzz:
607 ; SSE41: # BB#0:
608 ; SSE41-NEXT: xorps %xmm1, %xmm1
609 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3]
610 ; SSE41-NEXT: retq
643 ; SSE41-LABEL: shuffle_v4f32_z4zz:
644 ; SSE41: # BB#0:
645 ; SSE41-NEXT: insertps {{.*#+}} xmm0 = zero,xmm0[0],zero,zero
646 ; SSE41-NEXT: retq
681 ; SSE41-LABEL: shuffle_v4f32_zz4z:
682 ; SSE41: # BB#0:
683 ; SSE41-NEXT: insertps {{.*#+}} xmm0 = zero,zero,xmm0[0],zero
684 ; SSE41-NEXT: retq
716 ; SSE41-LABEL: shuffle_v4f32_zuu4:
717 ; SSE41: # BB#0:
718 ; SSE41-NEXT: insertps {{.*#+}} xmm0 = zero,zero,zero,xmm0[0]
719 ; SSE41-NEXT: retq
754 ; SSE41-LABEL: shuffle_v4f32_zzz7:
755 ; SSE41: # BB#0:
756 ; SSE41-NEXT: xorps %xmm1, %xmm1
757 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm1[0,1,2],xmm0[3]
758 ; SSE41-NEXT: retq
791 ; SSE41-LABEL: shuffle_v4f32_z6zz:
792 ; SSE41: # BB#0:
793 ; SSE41-NEXT: insertps {{.*#+}} xmm0 = zero,xmm0[2],zero,zero
794 ; SSE41-NEXT: retq
829 ; SSE41-LABEL: shuffle_v4f32_0z23:
830 ; SSE41: # BB#0:
831 ; SSE41-NEXT: xorps %xmm1, %xmm1
832 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2,3]
833 ; SSE41-NEXT: retq
866 ; SSE41-LABEL: shuffle_v4f32_01z3:
867 ; SSE41: # BB#0:
868 ; SSE41-NEXT: xorps %xmm1, %xmm1
869 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0,1],xmm1[2],xmm0[3]
870 ; SSE41-NEXT: retq
903 ; SSE41-LABEL: shuffle_v4f32_012z:
904 ; SSE41: # BB#0:
905 ; SSE41-NEXT: xorps %xmm1, %xmm1
906 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0,1,2],xmm1[3]
907 ; SSE41-NEXT: retq
940 ; SSE41-LABEL: shuffle_v4f32_0zz3:
941 ; SSE41: # BB#0:
942 ; SSE41-NEXT: xorps %xmm1, %xmm1
943 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2],xmm0[3]
944 ; SSE41-NEXT: retq
992 ; SSE41-LABEL: shuffle_v4i32_4zzz:
993 ; SSE41: # BB#0:
994 ; SSE41-NEXT: pxor %xmm1, %xmm1
995 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5,6,7]
996 ; SSE41-NEXT: retq
1029 ; SSE41-LABEL: shuffle_v4i32_z4zz:
1030 ; SSE41: # BB#0:
1031 ; SSE41-NEXT: pxor %xmm1, %xmm1
1032 ; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3,4,5,6,7]
1033 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,0,1,1]
1034 ; SSE41-NEXT: retq
1068 ; SSE41-LABEL: shuffle_v4i32_zz4z:
1069 ; SSE41: # BB#0:
1070 ; SSE41-NEXT: pxor %xmm1, %xmm1
1071 ; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm0[0,1],xmm1[2,3,4,5,6,7]
1072 ; SSE41-NEXT: pshufd {{.*#+}} xmm0 = xmm1[1,1,0,1]
1073 ; SSE41-NEXT: retq
1121 ; SSE41-LABEL: shuffle_v4i32_z6zz:
1122 ; SSE41: # BB#0:
1123 ; SSE41-NEXT: pshufd {{.*#+}} xmm1 = xmm0[2,2,3,3]
1124 ; SSE41-NEXT: pxor %xmm0, %xmm0
1125 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5,6,7]
1126 ; SSE41-NEXT: retq
1165 ; SSE41-LABEL: shuffle_v4i32_7012:
1166 ; SSE41: # BB#0:
1167 ; SSE41-NEXT: palignr {{.*#+}} xmm0 = xmm1[12,13,14,15],xmm0[0,1,2,3,4,5,6,7,8,9,10,11]
1168 ; SSE41-NEXT: retq
1196 ; SSE41-LABEL: shuffle_v4i32_6701:
1197 ; SSE41: # BB#0:
1198 ; SSE41-NEXT: palignr {{.*#+}} xmm0 = xmm1[8,9,10,11,12,13,14,15],xmm0[0,1,2,3,4,5,6,7]
1199 ; SSE41-NEXT: retq
1229 ; SSE41-LABEL: shuffle_v4i32_5670:
1230 ; SSE41: # BB#0:
1231 ; SSE41-NEXT: palignr {{.*#+}} xmm0 = xmm1[4,5,6,7,8,9,10,11,12,13,14,15],xmm0[0,1,2,3]
1232 ; SSE41-NEXT: retq
1261 ; SSE41-LABEL: shuffle_v4i32_1234:
1262 ; SSE41: # BB#0:
1263 ; SSE41-NEXT: palignr {{.*#+}} xmm1 = xmm0[4,5,6,7,8,9,10,11,12,13,14,15],xmm1[0,1,2,3]
1264 ; SSE41-NEXT: movdqa %xmm1, %xmm0
1265 ; SSE41-NEXT: retq
1292 ; SSE41-LABEL: shuffle_v4i32_2345:
1293 ; SSE41: # BB#0:
1294 ; SSE41-NEXT: palignr {{.*#+}} xmm1 = xmm0[8,9,10,11,12,13,14,15],xmm1[0,1,2,3,4,5,6,7]
1295 ; SSE41-NEXT: movdqa %xmm1, %xmm0
1296 ; SSE41-NEXT: retq
1340 ; SSE41-LABEL: shuffle_v4i32_3456:
1341 ; SSE41: # BB#0:
1342 ; SSE41-NEXT: palignr {{.*#+}} xmm1 = xmm0[12,13,14,15],xmm1[0,1,2,3,4,5,6,7,8,9,10,11]
1343 ; SSE41-NEXT: movdqa %xmm1, %xmm0
1344 ; SSE41-NEXT: retq
1370 ; SSE41-LABEL: shuffle_v4i32_0u1u:
1371 ; SSE41: # BB#0:
1372 ; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
1373 ; SSE41-NEXT: retq
1402 ; SSE41-LABEL: shuffle_v4i32_0z1z:
1403 ; SSE41: # BB#0:
1404 ; SSE41-NEXT: pmovzxdq {{.*#+}} xmm0 = xmm0[0],zero,xmm0[1],zero
1405 ; SSE41-NEXT: retq
1445 ; SSE41-LABEL: shuffle_v4i32_0z23:
1446 ; SSE41: # BB#0:
1447 ; SSE41-NEXT: pxor %xmm1, %xmm1
1448 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3],xmm0[4,5,6,7]
1449 ; SSE41-NEXT: retq
1482 ; SSE41-LABEL: shuffle_v4i32_01z3:
1483 ; SSE41: # BB#0:
1484 ; SSE41-NEXT: pxor %xmm1, %xmm1
1485 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm1[4,5],xmm0[6,7]
1486 ; SSE41-NEXT: retq
1519 ; SSE41-LABEL: shuffle_v4i32_012z:
1520 ; SSE41: # BB#0:
1521 ; SSE41-NEXT: pxor %xmm1, %xmm1
1522 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3,4,5],xmm1[6,7]
1523 ; SSE41-NEXT: retq
1556 ; SSE41-LABEL: shuffle_v4i32_0zz3:
1557 ; SSE41: # BB#0:
1558 ; SSE41-NEXT: pxor %xmm1, %xmm1
1559 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm1[2,3,4,5],xmm0[6,7]
1560 ; SSE41-NEXT: retq
1647 ; SSE41-LABEL: insert_reg_and_zero_v4f32:
1648 ; SSE41: # BB#0:
1649 ; SSE41-NEXT: xorps %xmm1, %xmm1
1650 ; SSE41-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3]
1651 ; SSE41-NEXT: retq
1698 ; SSE41-LABEL: insert_reg_lo_v4i32:
1699 ; SSE41: # BB#0:
1700 ; SSE41-NEXT: movd %rdi, %xmm1
1701 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
1702 ; SSE41-NEXT: retq
1737 ; SSE41-LABEL: insert_mem_lo_v4i32:
1738 ; SSE41: # BB#0:
1739 ; SSE41-NEXT: movq {{.*#+}} xmm1 = mem[0],zero
1740 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm1[0,1,2,3],xmm0[4,5,6,7]
1741 ; SSE41-NEXT: retq