Lines Matching refs:xmm3
92 ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
95 ; AVX1-NEXT: vpmuldq %xmm3, %xmm5, %xmm3
98 ; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
100 ; AVX1-NEXT: vpsrld $31, %xmm2, %xmm3
102 ; AVX1-NEXT: vpaddd %xmm3, %xmm2, %xmm2
103 ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm1[1,1,3,3]
105 ; AVX1-NEXT: vpmuldq %xmm3, %xmm4, %xmm3
108 ; AVX1-NEXT: vpblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]
140 ; AVX1-NEXT: vpsrlw $15, %xmm1, %xmm3
142 ; AVX1-NEXT: vpaddw %xmm3, %xmm1, %xmm1
166 ; AVX1-NEXT: vpmovsxbw {{.*}}(%rip), %xmm3
167 ; AVX1-NEXT: vpmullw %xmm3, %xmm2, %xmm2
171 ; AVX1-NEXT: vpmullw %xmm3, %xmm4, %xmm4
186 ; AVX1-NEXT: vpmullw %xmm3, %xmm2, %xmm2
190 ; AVX1-NEXT: vpmullw %xmm3, %xmm7, %xmm3
191 ; AVX1-NEXT: vpsrlw $8, %xmm3, %xmm3
192 ; AVX1-NEXT: vpackuswb %xmm3, %xmm2, %xmm2
209 ; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3
210 ; AVX2-NEXT: vpmovsxbw %xmm3, %ymm3
353 ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
356 ; AVX1-NEXT: vpmuldq %xmm3, %xmm5, %xmm3
359 ; AVX1-NEXT: vpblendw {{.*#+}} xmm2 = xmm2[0,1],xmm3[2,3],xmm2[4,5],xmm3[6,7]
361 ; AVX1-NEXT: vpsrld $31, %xmm2, %xmm3
363 ; AVX1-NEXT: vpaddd %xmm3, %xmm2, %xmm2
364 ; AVX1-NEXT: vmovdqa {{.*#+}} xmm3 = [7,7,7,7]
365 ; AVX1-NEXT: vpmulld %xmm3, %xmm2, %xmm2
377 ; AVX1-NEXT: vpmulld %xmm3, %xmm1, %xmm1
408 ; AVX1-NEXT: vpmulhw %xmm2, %xmm1, %xmm3
409 ; AVX1-NEXT: vpsrlw $15, %xmm3, %xmm4
410 ; AVX1-NEXT: vpsraw $1, %xmm3, %xmm3
411 ; AVX1-NEXT: vpaddw %xmm4, %xmm3, %xmm3
413 ; AVX1-NEXT: vpmullw %xmm4, %xmm3, %xmm3
414 ; AVX1-NEXT: vpsubw %xmm3, %xmm1, %xmm1
416 ; AVX1-NEXT: vpsrlw $15, %xmm2, %xmm3
418 ; AVX1-NEXT: vpaddw %xmm3, %xmm2, %xmm2
441 ; AVX1-NEXT: vpmovsxbw %xmm2, %xmm3
443 ; AVX1-NEXT: vpmullw %xmm1, %xmm3, %xmm3
444 ; AVX1-NEXT: vpsrlw $8, %xmm3, %xmm3
449 ; AVX1-NEXT: vpackuswb %xmm4, %xmm3, %xmm3
450 ; AVX1-NEXT: vpaddb %xmm2, %xmm3, %xmm3
451 ; AVX1-NEXT: vpsrlw $7, %xmm3, %xmm4
454 ; AVX1-NEXT: vpsrlw $2, %xmm3, %xmm3
456 ; AVX1-NEXT: vpand %xmm9, %xmm3, %xmm3
458 ; AVX1-NEXT: vpxor %xmm7, %xmm3, %xmm3
459 ; AVX1-NEXT: vpsubb %xmm7, %xmm3, %xmm3
460 ; AVX1-NEXT: vpaddb %xmm4, %xmm3, %xmm3
461 ; AVX1-NEXT: vpmovsxbw %xmm3, %xmm4
466 ; AVX1-NEXT: vpshufd {{.*#+}} xmm3 = xmm3[2,3,0,1]
467 ; AVX1-NEXT: vpmovsxbw %xmm3, %xmm3
468 ; AVX1-NEXT: vpmullw %xmm5, %xmm3, %xmm3
469 ; AVX1-NEXT: vpand %xmm6, %xmm3, %xmm3
470 ; AVX1-NEXT: vpackuswb %xmm3, %xmm4, %xmm3
471 ; AVX1-NEXT: vpsubb %xmm3, %xmm2, %xmm2
472 ; AVX1-NEXT: vpmovsxbw %xmm0, %xmm3
473 ; AVX1-NEXT: vpmullw %xmm1, %xmm3, %xmm3
474 ; AVX1-NEXT: vpsrlw $8, %xmm3, %xmm3
479 ; AVX1-NEXT: vpackuswb %xmm1, %xmm3, %xmm1
481 ; AVX1-NEXT: vpsrlw $7, %xmm1, %xmm3
482 ; AVX1-NEXT: vpand %xmm8, %xmm3, %xmm3
487 ; AVX1-NEXT: vpaddb %xmm3, %xmm1, %xmm1
488 ; AVX1-NEXT: vpmovsxbw %xmm1, %xmm3
489 ; AVX1-NEXT: vpmullw %xmm5, %xmm3, %xmm3
490 ; AVX1-NEXT: vpand %xmm6, %xmm3, %xmm3
495 ; AVX1-NEXT: vpackuswb %xmm1, %xmm3, %xmm1
505 ; AVX2-NEXT: vextracti128 $1, %ymm0, %xmm3
506 ; AVX2-NEXT: vpmovsxbw %xmm3, %ymm3
536 ; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3
537 ; AVX2-NEXT: vpshufb %xmm5, %xmm3, %xmm3
539 ; AVX2-NEXT: vpunpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm3[0]