• Home
  • Raw
  • Download

Lines Matching refs:xmm4

22 ; SSE2-NEXT:    movdqa %xmm0, %xmm4
23 ; SSE2-NEXT: psllq %xmm3, %xmm4
26 ; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm3[0],xmm4[1]
32 ; SSE2-NEXT: orpd %xmm4, %xmm1
43 ; SSE41-NEXT: movdqa %xmm0, %xmm4
44 ; SSE41-NEXT: psllq %xmm1, %xmm4
45 ; SSE41-NEXT: pblendw {{.*#+}} xmm4 = xmm3[0,1,2,3],xmm4[4,5,6,7]
51 ; SSE41-NEXT: por %xmm4, %xmm0
88 ; X32-SSE-NEXT: movdqa %xmm0, %xmm4
89 ; X32-SSE-NEXT: psllq %xmm3, %xmm4
93 ; X32-SSE-NEXT: movsd {{.*#+}} xmm4 = xmm3[0],xmm4[1]
100 ; X32-SSE-NEXT: orpd %xmm4, %xmm1
121 ; SSE2-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]
122 ; SSE2-NEXT: pmuludq %xmm3, %xmm4
123 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[0,2,2,3]
127 ; SSE2-NEXT: movdqa %xmm0, %xmm4
128 ; SSE2-NEXT: psrld %xmm3, %xmm4
133 ; SSE2-NEXT: movsd {{.*#+}} xmm4 = xmm5[0],xmm4[1]
134 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,3,2,3]
135 ; SSE2-NEXT: pxor %xmm4, %xmm4
137 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm5 = xmm5[2],xmm4[2],xmm5[3],xmm4[3]
140 ; SSE2-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm4[0],xmm2[1],xmm4[1]
158 ; SSE41-NEXT: movdqa %xmm0, %xmm4
159 ; SSE41-NEXT: psrld %xmm3, %xmm4
164 ; SSE41-NEXT: pblendw {{.*#+}} xmm5 = xmm5[0,1,2,3],xmm4[4,5,6,7]
166 ; SSE41-NEXT: pmovzxdq {{.*#+}} xmm4 = xmm2[0],zero,xmm2[1],zero
170 ; SSE41-NEXT: psrld %xmm4, %xmm0
186 ; AVX1-NEXT: vpsrlq $32, %xmm2, %xmm4
187 ; AVX1-NEXT: vpsrld %xmm4, %xmm0, %xmm4
188 ; AVX1-NEXT: vpblendw {{.*#+}} xmm3 = xmm4[0,1,2,3],xmm3[4,5,6,7]
189 ; AVX1-NEXT: vpxor %xmm4, %xmm4, %xmm4
190 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm4 = xmm2[2],xmm4[2],xmm2[3],xmm4[3]
191 ; AVX1-NEXT: vpsrld %xmm4, %xmm0, %xmm4
194 ; AVX1-NEXT: vpblendw {{.*#+}} xmm0 = xmm0[0,1,2,3],xmm4[4,5,6,7]
223 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm4 = xmm0[1,1,3,3]
224 ; X32-SSE-NEXT: pmuludq %xmm3, %xmm4
225 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm4[0,2,2,3]
229 ; X32-SSE-NEXT: movdqa %xmm0, %xmm4
230 ; X32-SSE-NEXT: psrld %xmm3, %xmm4
235 ; X32-SSE-NEXT: movsd {{.*#+}} xmm4 = xmm5[0],xmm4[1]
236 ; X32-SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,3,2,3]
237 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
239 ; X32-SSE-NEXT: punpckhdq {{.*#+}} xmm5 = xmm5[2],xmm4[2],xmm5[3],xmm4[3]
242 ; X32-SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm4[0],xmm2[1],xmm4[1]
264 ; SSE2-NEXT: movdqa %xmm0, %xmm4
265 ; SSE2-NEXT: psllw $8, %xmm4
266 ; SSE2-NEXT: pand %xmm2, %xmm4
268 ; SSE2-NEXT: por %xmm4, %xmm2
270 ; SSE2-NEXT: movdqa %xmm1, %xmm4
271 ; SSE2-NEXT: psraw $15, %xmm4
272 ; SSE2-NEXT: movdqa %xmm4, %xmm5
275 ; SSE2-NEXT: pand %xmm4, %xmm2
278 ; SSE2-NEXT: movdqa %xmm1, %xmm4
279 ; SSE2-NEXT: psraw $15, %xmm4
280 ; SSE2-NEXT: movdqa %xmm4, %xmm5
283 ; SSE2-NEXT: pand %xmm4, %xmm2
287 ; SSE2-NEXT: movdqa %xmm1, %xmm4
288 ; SSE2-NEXT: pandn %xmm2, %xmm4
322 ; SSE2-NEXT: por %xmm4, %xmm0
335 ; SSE41-NEXT: movdqa %xmm1, %xmm4
336 ; SSE41-NEXT: paddw %xmm4, %xmm4
344 ; SSE41-NEXT: movdqa %xmm4, %xmm0
348 ; SSE41-NEXT: paddw %xmm4, %xmm4
349 ; SSE41-NEXT: movdqa %xmm4, %xmm0
353 ; SSE41-NEXT: paddw %xmm4, %xmm4
354 ; SSE41-NEXT: movdqa %xmm4, %xmm0
362 ; SSE41-NEXT: movdqa %xmm3, %xmm4
363 ; SSE41-NEXT: psrlw $8, %xmm4
365 ; SSE41-NEXT: pblendvb %xmm4, %xmm3
392 ; AVX1-NEXT: vpsllw $8, %xmm0, %xmm4
393 ; AVX1-NEXT: vpblendvb %xmm1, %xmm4, %xmm0, %xmm1
394 ; AVX1-NEXT: vpsllw $4, %xmm1, %xmm4
395 ; AVX1-NEXT: vpblendvb %xmm3, %xmm4, %xmm1, %xmm1
396 ; AVX1-NEXT: vpsllw $2, %xmm1, %xmm4
398 ; AVX1-NEXT: vpblendvb %xmm3, %xmm4, %xmm1, %xmm1
399 ; AVX1-NEXT: vpsllw $1, %xmm1, %xmm4
401 ; AVX1-NEXT: vpblendvb %xmm3, %xmm4, %xmm1, %xmm1
406 ; AVX1-NEXT: vpsrlw $8, %xmm0, %xmm4
407 ; AVX1-NEXT: vpblendvb %xmm2, %xmm4, %xmm0, %xmm0
449 ; X32-SSE-NEXT: movdqa %xmm0, %xmm4
450 ; X32-SSE-NEXT: psllw $8, %xmm4
451 ; X32-SSE-NEXT: pand %xmm2, %xmm4
453 ; X32-SSE-NEXT: por %xmm4, %xmm2
455 ; X32-SSE-NEXT: movdqa %xmm1, %xmm4
456 ; X32-SSE-NEXT: psraw $15, %xmm4
457 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
460 ; X32-SSE-NEXT: pand %xmm4, %xmm2
463 ; X32-SSE-NEXT: movdqa %xmm1, %xmm4
464 ; X32-SSE-NEXT: psraw $15, %xmm4
465 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
468 ; X32-SSE-NEXT: pand %xmm4, %xmm2
472 ; X32-SSE-NEXT: movdqa %xmm1, %xmm4
473 ; X32-SSE-NEXT: pandn %xmm2, %xmm4
507 ; X32-SSE-NEXT: por %xmm4, %xmm0
520 ; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
521 ; SSE2-NEXT: psubb %xmm1, %xmm4
548 ; SSE2-NEXT: psllw $5, %xmm4
550 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm5
557 ; SSE2-NEXT: paddb %xmm4, %xmm4
559 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm5
566 ; SSE2-NEXT: paddb %xmm4, %xmm4
567 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm3
568 ; SSE2-NEXT: movdqa %xmm3, %xmm4
569 ; SSE2-NEXT: pandn %xmm0, %xmm4
573 ; SSE2-NEXT: por %xmm4, %xmm0
588 ; SSE41-NEXT: movdqa %xmm1, %xmm4
590 ; SSE41-NEXT: pblendvb %xmm5, %xmm4
591 ; SSE41-NEXT: movdqa %xmm4, %xmm5
596 ; SSE41-NEXT: pblendvb %xmm5, %xmm4
597 ; SSE41-NEXT: movdqa %xmm4, %xmm5
601 ; SSE41-NEXT: pblendvb %xmm5, %xmm4
621 ; SSE41-NEXT: por %xmm4, %xmm1
633 ; AVX-NEXT: vpsllw $2, %xmm3, %xmm4
634 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm4, %xmm4
636 ; AVX-NEXT: vpblendvb %xmm1, %xmm4, %xmm3, %xmm3
637 ; AVX-NEXT: vpaddb %xmm3, %xmm3, %xmm4
639 ; AVX-NEXT: vpblendvb %xmm1, %xmm4, %xmm3, %xmm1
642 ; AVX-NEXT: vpsrlw $4, %xmm0, %xmm4
643 ; AVX-NEXT: vpand {{.*}}(%rip), %xmm4, %xmm4
644 ; AVX-NEXT: vpblendvb %xmm2, %xmm4, %xmm0, %xmm0
662 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm4 = [8,8,8,8,8,8,8,8,8,8,8,8,8,8,8,8]
663 ; X32-SSE-NEXT: psubb %xmm1, %xmm4
690 ; X32-SSE-NEXT: psllw $5, %xmm4
692 ; X32-SSE-NEXT: pcmpgtb %xmm4, %xmm5
699 ; X32-SSE-NEXT: paddb %xmm4, %xmm4
701 ; X32-SSE-NEXT: pcmpgtb %xmm4, %xmm5
708 ; X32-SSE-NEXT: paddb %xmm4, %xmm4
709 ; X32-SSE-NEXT: pcmpgtb %xmm4, %xmm3
710 ; X32-SSE-NEXT: movdqa %xmm3, %xmm4
711 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
715 ; X32-SSE-NEXT: por %xmm4, %xmm0
1065 ; SSE2-NEXT: movdqa %xmm0, %xmm4
1066 ; SSE2-NEXT: psllw $4, %xmm4
1067 ; SSE2-NEXT: pand {{.*}}(%rip), %xmm4
1068 ; SSE2-NEXT: pand %xmm1, %xmm4
1070 ; SSE2-NEXT: por %xmm4, %xmm1
1072 ; SSE2-NEXT: pxor %xmm4, %xmm4
1073 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm4
1074 ; SSE2-NEXT: movdqa %xmm4, %xmm5
1078 ; SSE2-NEXT: pand %xmm4, %xmm1
1081 ; SSE2-NEXT: pxor %xmm4, %xmm4
1082 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm4
1083 ; SSE2-NEXT: movdqa %xmm4, %xmm3
1086 ; SSE2-NEXT: pand %xmm4, %xmm1
1087 ; SSE2-NEXT: movdqa {{.*#+}} xmm4 = [8,7,6,5,4,3,2,1,0,1,2,3,4,5,6,7]
1088 ; SSE2-NEXT: psllw $5, %xmm4
1090 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm5
1097 ; SSE2-NEXT: paddb %xmm4, %xmm4
1099 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm5
1106 ; SSE2-NEXT: paddb %xmm4, %xmm4
1107 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm2
1108 ; SSE2-NEXT: movdqa %xmm2, %xmm4
1109 ; SSE2-NEXT: pandn %xmm0, %xmm4
1113 ; SSE2-NEXT: por %xmm4, %xmm0
1203 ; X32-SSE-NEXT: movdqa %xmm0, %xmm4
1204 ; X32-SSE-NEXT: psllw $4, %xmm4
1205 ; X32-SSE-NEXT: pand .LCPI7_1, %xmm4
1206 ; X32-SSE-NEXT: pand %xmm1, %xmm4
1208 ; X32-SSE-NEXT: por %xmm4, %xmm1
1210 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
1211 ; X32-SSE-NEXT: pcmpgtb %xmm3, %xmm4
1212 ; X32-SSE-NEXT: movdqa %xmm4, %xmm5
1216 ; X32-SSE-NEXT: pand %xmm4, %xmm1
1219 ; X32-SSE-NEXT: pxor %xmm4, %xmm4
1220 ; X32-SSE-NEXT: pcmpgtb %xmm3, %xmm4
1221 ; X32-SSE-NEXT: movdqa %xmm4, %xmm3
1224 ; X32-SSE-NEXT: pand %xmm4, %xmm1
1225 ; X32-SSE-NEXT: movdqa {{.*#+}} xmm4 = [8,7,6,5,4,3,2,1,0,1,2,3,4,5,6,7]
1226 ; X32-SSE-NEXT: psllw $5, %xmm4
1228 ; X32-SSE-NEXT: pcmpgtb %xmm4, %xmm5
1235 ; X32-SSE-NEXT: paddb %xmm4, %xmm4
1237 ; X32-SSE-NEXT: pcmpgtb %xmm4, %xmm5
1244 ; X32-SSE-NEXT: paddb %xmm4, %xmm4
1245 ; X32-SSE-NEXT: pcmpgtb %xmm4, %xmm2
1246 ; X32-SSE-NEXT: movdqa %xmm2, %xmm4
1247 ; X32-SSE-NEXT: pandn %xmm0, %xmm4
1251 ; X32-SSE-NEXT: por %xmm4, %xmm0