• Home
  • Raw
  • Download

Lines Matching refs:xmm3

21 ; SSE2-NEXT:    pshufd {{.*#+}} xmm3 = xmm1[2,3,0,1]
23 ; SSE2-NEXT: psllq %xmm3, %xmm4
24 ; SSE2-NEXT: movdqa %xmm0, %xmm3
25 ; SSE2-NEXT: psllq %xmm1, %xmm3
26 ; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm3[0],xmm4[1]
27 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[2,3,0,1]
29 ; SSE2-NEXT: psrlq %xmm3, %xmm1
40 ; SSE41-NEXT: movdqa %xmm0, %xmm3
41 ; SSE41-NEXT: psllq %xmm1, %xmm3
45 ; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm3[0,1,2,3],xmm4[4,5,6,7]
58 ; AVX1-NEXT: vpsllq %xmm1, %xmm0, %xmm3
61 ; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm3[0,1,2,3],xmm1[4,5,6,7]
62 ; AVX1-NEXT: vpsrlq %xmm2, %xmm0, %xmm3
65 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm3[0,1,2,3],xmm0[4,5,6,7]
87 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm1[2,3,0,1]
89 ; X32-SSE-NEXT: psllq %xmm3, %xmm4
91 ; X32-SSE-NEXT: movdqa %xmm0, %xmm3
92 ; X32-SSE-NEXT: psllq %xmm1, %xmm3
93 ; X32-SSE-NEXT: movsd {{.*#+}} xmm4 = xmm3[0],xmm4[1]
94 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm2[2,3,0,1]
96 ; X32-SSE-NEXT: psrlq %xmm3, %xmm1
118 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm1[1,1,3,3]
122 ; SSE2-NEXT: pmuludq %xmm3, %xmm4
123 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[0,2,2,3]
124 ; SSE2-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1]
125 ; SSE2-NEXT: movdqa %xmm2, %xmm3
126 ; SSE2-NEXT: psrldq {{.*#+}} xmm3 = xmm3[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,ze…
128 ; SSE2-NEXT: psrld %xmm3, %xmm4
129 ; SSE2-NEXT: movdqa %xmm2, %xmm3
130 ; SSE2-NEXT: psrlq $32, %xmm3
132 ; SSE2-NEXT: psrld %xmm3, %xmm5
134 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,3,2,3]
144 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1]
156 ; SSE41-NEXT: movdqa %xmm2, %xmm3
157 ; SSE41-NEXT: psrldq {{.*#+}} xmm3 = xmm3[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,z…
159 ; SSE41-NEXT: psrld %xmm3, %xmm4
160 ; SSE41-NEXT: movdqa %xmm2, %xmm3
161 ; SSE41-NEXT: psrlq $32, %xmm3
163 ; SSE41-NEXT: psrld %xmm3, %xmm5
165 ; SSE41-NEXT: pxor %xmm3, %xmm3
167 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm3[2],xmm2[3],xmm3[3]
168 ; SSE41-NEXT: movdqa %xmm0, %xmm3
169 ; SSE41-NEXT: psrld %xmm2, %xmm3
171 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm3[4,5,6,7]
184 ; AVX1-NEXT: vpsrldq {{.*#+}} xmm3 = xmm2[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero,z…
185 ; AVX1-NEXT: vpsrld %xmm3, %xmm0, %xmm3
188 ; AVX1-NEXT: vpblendw {{.*#+}} xmm3 = xmm4[0,1,2,3],xmm3[4,5,6,7]
195 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1],xmm3[2,3],xmm0[4,5],xmm3[6,7]
220 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm1[1,1,3,3]
224 ; X32-SSE-NEXT: pmuludq %xmm3, %xmm4
225 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm4[0,2,2,3]
226 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1]
227 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
228 ; X32-SSE-NEXT: psrldq {{.*#+}} xmm3 = xmm3[12,13,14,15],zero,zero,zero,zero,zero,zero,zero,zero…
230 ; X32-SSE-NEXT: psrld %xmm3, %xmm4
231 ; X32-SSE-NEXT: movdqa %xmm2, %xmm3
232 ; X32-SSE-NEXT: psrlq $32, %xmm3
234 ; X32-SSE-NEXT: psrld %xmm3, %xmm5
236 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,3,2,3]
246 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1]
259 ; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [16,16,16,16,16,16,16,16]
260 ; SSE2-NEXT: psubw %xmm1, %xmm3
291 ; SSE2-NEXT: psllw $12, %xmm3
292 ; SSE2-NEXT: movdqa %xmm3, %xmm1
299 ; SSE2-NEXT: paddw %xmm3, %xmm3
300 ; SSE2-NEXT: movdqa %xmm3, %xmm1
307 ; SSE2-NEXT: paddw %xmm3, %xmm3
308 ; SSE2-NEXT: movdqa %xmm3, %xmm1
315 ; SSE2-NEXT: paddw %xmm3, %xmm3
316 ; SSE2-NEXT: psraw $15, %xmm3
317 ; SSE2-NEXT: movdqa %xmm3, %xmm1
320 ; SSE2-NEXT: pand %xmm3, %xmm0
328 ; SSE41-NEXT: movdqa %xmm0, %xmm3
337 ; SSE41-NEXT: movdqa %xmm3, %xmm6
339 ; SSE41-NEXT: movdqa %xmm3, %xmm5
362 ; SSE41-NEXT: movdqa %xmm3, %xmm4
365 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
366 ; SSE41-NEXT: movdqa %xmm3, %xmm2
369 ; SSE41-NEXT: pblendvb %xmm2, %xmm3
370 ; SSE41-NEXT: movdqa %xmm3, %xmm2
374 ; SSE41-NEXT: pblendvb %xmm2, %xmm3
375 ; SSE41-NEXT: movdqa %xmm3, %xmm2
379 ; SSE41-NEXT: pblendvb %xmm2, %xmm3
380 ; SSE41-NEXT: por %xmm5, %xmm3
381 ; SSE41-NEXT: movdqa %xmm3, %xmm0
388 ; AVX1-NEXT: vpsllw $12, %xmm1, %xmm3
390 ; AVX1-NEXT: vpor %xmm3, %xmm1, %xmm1
391 ; AVX1-NEXT: vpaddw %xmm1, %xmm1, %xmm3
395 ; AVX1-NEXT: vpblendvb %xmm3, %xmm4, %xmm1, %xmm1
397 ; AVX1-NEXT: vpaddw %xmm3, %xmm3, %xmm3
398 ; AVX1-NEXT: vpblendvb %xmm3, %xmm4, %xmm1, %xmm1
400 ; AVX1-NEXT: vpaddw %xmm3, %xmm3, %xmm3
401 ; AVX1-NEXT: vpblendvb %xmm3, %xmm4, %xmm1, %xmm1
402 ; AVX1-NEXT: vpsllw $12, %xmm2, %xmm3
404 ; AVX1-NEXT: vpor %xmm3, %xmm2, %xmm2
405 ; AVX1-NEXT: vpaddw %xmm2, %xmm2, %xmm3
409 ; AVX1-NEXT: vpblendvb %xmm3, %xmm2, %xmm0, %xmm0
411 ; AVX1-NEXT: vpaddw %xmm3, %xmm3, %xmm3
412 ; AVX1-NEXT: vpblendvb %xmm3, %xmm2, %xmm0, %xmm0
414 ; AVX1-NEXT: vpaddw %xmm3, %xmm3, %xmm3
415 ; AVX1-NEXT: vpblendvb %xmm3, %xmm2, %xmm0, %xmm0
444 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm3 = [16,16,16,16,16,16,16,16]
445 ; X32-SSE-NEXT: psubw %xmm1, %xmm3
476 ; X32-SSE-NEXT: psllw $12, %xmm3
477 ; X32-SSE-NEXT: movdqa %xmm3, %xmm1
484 ; X32-SSE-NEXT: paddw %xmm3, %xmm3
485 ; X32-SSE-NEXT: movdqa %xmm3, %xmm1
492 ; X32-SSE-NEXT: paddw %xmm3, %xmm3
493 ; X32-SSE-NEXT: movdqa %xmm3, %xmm1
500 ; X32-SSE-NEXT: paddw %xmm3, %xmm3
501 ; X32-SSE-NEXT: psraw $15, %xmm3
502 ; X32-SSE-NEXT: movdqa %xmm3, %xmm1
505 ; X32-SSE-NEXT: pand %xmm3, %xmm0
523 ; SSE2-NEXT: pxor %xmm3, %xmm3
567 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm3
568 ; SSE2-NEXT: movdqa %xmm3, %xmm4
572 ; SSE2-NEXT: pand %xmm3, %xmm0
580 ; SSE41-NEXT: movdqa %xmm1, %xmm3
583 ; SSE41-NEXT: psubb %xmm3, %xmm2
584 ; SSE41-NEXT: psllw $5, %xmm3
589 ; SSE41-NEXT: movdqa %xmm3, %xmm0
594 ; SSE41-NEXT: paddb %xmm3, %xmm3
595 ; SSE41-NEXT: movdqa %xmm3, %xmm0
599 ; SSE41-NEXT: paddb %xmm3, %xmm3
600 ; SSE41-NEXT: movdqa %xmm3, %xmm0
603 ; SSE41-NEXT: movdqa %xmm2, %xmm3
604 ; SSE41-NEXT: paddb %xmm3, %xmm3
613 ; SSE41-NEXT: movdqa %xmm3, %xmm0
618 ; SSE41-NEXT: paddb %xmm3, %xmm3
619 ; SSE41-NEXT: movdqa %xmm3, %xmm0
630 ; AVX-NEXT: vpsllw $4, %xmm0, %xmm3
631 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm3, %xmm3
632 ; AVX-NEXT: vpblendvb %xmm1, %xmm3, %xmm0, %xmm3
633 ; AVX-NEXT: vpsllw $2, %xmm3, %xmm4
636 ; AVX-NEXT: vpblendvb %xmm1, %xmm4, %xmm3, %xmm3
637 ; AVX-NEXT: vpaddb %xmm3, %xmm3, %xmm4
639 ; AVX-NEXT: vpblendvb %xmm1, %xmm4, %xmm3, %xmm1
641 ; AVX-NEXT: vpaddb %xmm2, %xmm2, %xmm3
647 ; AVX-NEXT: vpblendvb %xmm3, %xmm2, %xmm0, %xmm0
650 ; AVX-NEXT: vpaddb %xmm3, %xmm3, %xmm3
651 ; AVX-NEXT: vpblendvb %xmm3, %xmm2, %xmm0, %xmm0
665 ; X32-SSE-NEXT: pxor %xmm3, %xmm3
709 ; X32-SSE-NEXT: pcmpgtb %xmm4, %xmm3
710 ; X32-SSE-NEXT: movdqa %xmm3, %xmm4
714 ; X32-SSE-NEXT: pand %xmm3, %xmm0
822 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
823 ; SSE2-NEXT: pmuludq %xmm1, %xmm3
824 ; SSE2-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,2,2,3]
828 ; SSE2-NEXT: movdqa %xmm0, %xmm3
829 ; SSE2-NEXT: psrld $27, %xmm3
830 ; SSE2-NEXT: movsd {{.*#+}} xmm1 = xmm3[0],xmm1[1]
832 ; SSE2-NEXT: movdqa %xmm0, %xmm3
833 ; SSE2-NEXT: psrld $26, %xmm3
835 ; SSE2-NEXT: movsd {{.*#+}} xmm3 = xmm0[0],xmm3[1]
836 ; SSE2-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,2,2,3]
847 ; SSE41-NEXT: movdqa %xmm0, %xmm3
848 ; SSE41-NEXT: psrld $27, %xmm3
849 ; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm2[4,5,6,7]
854 ; SSE41-NEXT: pblendw {{.*#+}} xmm0 = xmm0[0,1],xmm3[2,3],xmm0[4,5],xmm3[6,7]
862 ; AVX1-NEXT: vpsrld $27, %xmm0, %xmm3
863 ; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm3[0,1,2,3],xmm2[4,5,6,7]
864 ; AVX1-NEXT: vpsrld $26, %xmm0, %xmm3
866 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm3[4,5,6,7]
899 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
900 ; X32-SSE-NEXT: pmuludq %xmm1, %xmm3
901 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,2,2,3]
905 ; X32-SSE-NEXT: movdqa %xmm0, %xmm3
906 ; X32-SSE-NEXT: psrld $27, %xmm3
907 ; X32-SSE-NEXT: movsd {{.*#+}} xmm1 = xmm3[0],xmm1[1]
909 ; X32-SSE-NEXT: movdqa %xmm0, %xmm3
910 ; X32-SSE-NEXT: psrld $26, %xmm3
912 ; X32-SSE-NEXT: movsd {{.*#+}} xmm3 = xmm0[0],xmm3[1]
913 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm0 = xmm3[0,2,2,3]
929 ; SSE2-NEXT: movdqa %xmm1, %xmm3
930 ; SSE2-NEXT: pandn %xmm0, %xmm3
933 ; SSE2-NEXT: por %xmm3, %xmm0
935 ; SSE2-NEXT: movdqa %xmm1, %xmm3
936 ; SSE2-NEXT: pandn %xmm0, %xmm3
939 ; SSE2-NEXT: por %xmm3, %xmm0
941 ; SSE2-NEXT: movdqa %xmm1, %xmm3
942 ; SSE2-NEXT: pandn %xmm0, %xmm3
945 ; SSE2-NEXT: por %xmm3, %xmm0
946 ; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [65535,0,65535,0,65535,0,65535,0]
948 ; SSE2-NEXT: pand %xmm3, %xmm1
950 ; SSE2-NEXT: pandn %xmm0, %xmm3
951 ; SSE2-NEXT: por %xmm2, %xmm3
952 ; SSE2-NEXT: por %xmm3, %xmm1
1014 ; X32-SSE-NEXT: movdqa %xmm1, %xmm3
1015 ; X32-SSE-NEXT: pandn %xmm0, %xmm3
1018 ; X32-SSE-NEXT: por %xmm3, %xmm0
1020 ; X32-SSE-NEXT: movdqa %xmm1, %xmm3
1021 ; X32-SSE-NEXT: pandn %xmm0, %xmm3
1024 ; X32-SSE-NEXT: por %xmm3, %xmm0
1026 ; X32-SSE-NEXT: movdqa %xmm1, %xmm3
1027 ; X32-SSE-NEXT: pandn %xmm0, %xmm3
1030 ; X32-SSE-NEXT: por %xmm3, %xmm0
1031 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm3 = [65535,0,65535,0,65535,0,65535,0]
1033 ; X32-SSE-NEXT: pand %xmm3, %xmm1
1035 ; X32-SSE-NEXT: pandn %xmm0, %xmm3
1036 ; X32-SSE-NEXT: por %xmm2, %xmm3
1037 ; X32-SSE-NEXT: por %xmm3, %xmm1
1049 ; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7,8,7,6,5,4,3,2,1]
1050 ; SSE2-NEXT: psllw $5, %xmm3
1053 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm1
1060 ; SSE2-NEXT: paddb %xmm3, %xmm3
1062 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm4
1069 ; SSE2-NEXT: paddb %xmm3, %xmm3
1071 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm4
1072 ; SSE2-NEXT: movdqa %xmm4, %xmm3
1073 ; SSE2-NEXT: pandn %xmm1, %xmm3
1103 ; SSE2-NEXT: por %xmm3, %xmm0
1112 ; SSE41-NEXT: movdqa %xmm1, %xmm3
1113 ; SSE41-NEXT: psllw $4, %xmm3
1114 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm3
1116 ; SSE41-NEXT: pblendvb %xmm3, %xmm2
1117 ; SSE41-NEXT: movdqa %xmm2, %xmm3
1118 ; SSE41-NEXT: psllw $2, %xmm3
1119 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm3
1121 ; SSE41-NEXT: pblendvb %xmm3, %xmm2
1122 ; SSE41-NEXT: movdqa %xmm2, %xmm3
1123 ; SSE41-NEXT: paddb %xmm3, %xmm3
1125 ; SSE41-NEXT: pblendvb %xmm3, %xmm2
1128 ; SSE41-NEXT: movdqa %xmm1, %xmm3
1129 ; SSE41-NEXT: psrlw $4, %xmm3
1130 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm3
1131 ; SSE41-NEXT: pblendvb %xmm3, %xmm1
1132 ; SSE41-NEXT: movdqa %xmm1, %xmm3
1133 ; SSE41-NEXT: psrlw $2, %xmm3
1134 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm3
1136 ; SSE41-NEXT: pblendvb %xmm3, %xmm1
1137 ; SSE41-NEXT: movdqa %xmm1, %xmm3
1138 ; SSE41-NEXT: psrlw $1, %xmm3
1139 ; SSE41-NEXT: pand {{.*}}(%rip), %xmm3
1141 ; SSE41-NEXT: pblendvb %xmm3, %xmm1
1153 ; AVX-NEXT: vpsllw $2, %xmm2, %xmm3
1154 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm3, %xmm3
1156 ; AVX-NEXT: vpblendvb %xmm1, %xmm3, %xmm2, %xmm2
1157 ; AVX-NEXT: vpaddb %xmm2, %xmm2, %xmm3
1159 ; AVX-NEXT: vpblendvb %xmm1, %xmm3, %xmm2, %xmm1
1162 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm3
1163 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm3, %xmm3
1164 ; AVX-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
1165 ; AVX-NEXT: vpsrlw $2, %xmm0, %xmm3
1166 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm3, %xmm3
1168 ; AVX-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
1169 ; AVX-NEXT: vpsrlw $1, %xmm0, %xmm3
1170 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm3, %xmm3
1172 ; AVX-NEXT: vpblendvb %xmm2, %xmm3, %xmm0, %xmm0
1187 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm3 = [0,1,2,3,4,5,6,7,8,7,6,5,4,3,2,1]
1188 ; X32-SSE-NEXT: psllw $5, %xmm3
1191 ; X32-SSE-NEXT: pcmpgtb %xmm3, %xmm1
1198 ; X32-SSE-NEXT: paddb %xmm3, %xmm3
1200 ; X32-SSE-NEXT: pcmpgtb %xmm3, %xmm4
1207 ; X32-SSE-NEXT: paddb %xmm3, %xmm3
1209 ; X32-SSE-NEXT: pcmpgtb %xmm3, %xmm4
1210 ; X32-SSE-NEXT: movdqa %xmm4, %xmm3
1211 ; X32-SSE-NEXT: pandn %xmm1, %xmm3
1241 ; X32-SSE-NEXT: por %xmm3, %xmm0