• Home
  • Raw
  • Download

Lines Matching refs:xmm1

16 ; SSE2-NEXT:    movd %rax, %xmm1
22 ; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
23 ; SSE2-NEXT: movdqa %xmm1, %xmm0
32 ; SSE3-NEXT: movd %rax, %xmm1
38 ; SSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
39 ; SSE3-NEXT: movdqa %xmm1, %xmm0
48 ; SSSE3-NEXT: movd %rax, %xmm1
54 ; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
55 ; SSSE3-NEXT: movdqa %xmm1, %xmm0
64 ; SSE41-NEXT: movd %rax, %xmm1
69 ; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
78 ; AVX-NEXT: vmovq %rax, %xmm1
83 ; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
94 ; SSE2-NEXT: movd %rax, %xmm1
99 ; SSE2-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
100 ; SSE2-NEXT: movdqa %xmm1, %xmm0
107 ; SSE3-NEXT: movd %rax, %xmm1
112 ; SSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
113 ; SSE3-NEXT: movdqa %xmm1, %xmm0
120 ; SSSE3-NEXT: movd %rax, %xmm1
125 ; SSSE3-NEXT: punpcklqdq {{.*#+}} xmm1 = xmm1[0],xmm0[0]
126 ; SSSE3-NEXT: movdqa %xmm1, %xmm0
133 ; SSE41-NEXT: movd %rax, %xmm1
137 ; SSE41-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
144 ; AVX-NEXT: vmovq %rax, %xmm1
148 ; AVX-NEXT: vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
157 ; SSE2-NEXT: pxor %xmm1, %xmm1
177 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
178 ; SSE2-NEXT: psadbw %xmm1, %xmm2
179 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
180 ; SSE2-NEXT: psadbw %xmm1, %xmm0
186 ; SSE3-NEXT: pxor %xmm1, %xmm1
206 ; SSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
207 ; SSE3-NEXT: psadbw %xmm1, %xmm2
208 ; SSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
209 ; SSE3-NEXT: psadbw %xmm1, %xmm0
215 ; SSSE3-NEXT: pxor %xmm1, %xmm1
231 ; SSSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
232 ; SSSE3-NEXT: psadbw %xmm1, %xmm2
233 ; SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
234 ; SSSE3-NEXT: psadbw %xmm1, %xmm0
240 ; SSE41-NEXT: pxor %xmm1, %xmm1
256 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
257 ; SSE41-NEXT: psadbw %xmm1, %xmm2
258 ; SSE41-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
259 ; SSE41-NEXT: psadbw %xmm1, %xmm0
265 ; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
266 ; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm2
277 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
278 ; AVX1-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
279 ; AVX1-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
280 ; AVX1-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
286 ; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
287 ; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm2
299 ; AVX2-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
300 ; AVX2-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
301 ; AVX2-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
302 ; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
312 ; SSE2-NEXT: pxor %xmm1, %xmm1
332 ; SSE2-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
333 ; SSE2-NEXT: psadbw %xmm1, %xmm2
334 ; SSE2-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
335 ; SSE2-NEXT: psadbw %xmm1, %xmm0
341 ; SSE3-NEXT: pxor %xmm1, %xmm1
361 ; SSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
362 ; SSE3-NEXT: psadbw %xmm1, %xmm2
363 ; SSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
364 ; SSE3-NEXT: psadbw %xmm1, %xmm0
370 ; SSSE3-NEXT: pxor %xmm1, %xmm1
386 ; SSSE3-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
387 ; SSSE3-NEXT: psadbw %xmm1, %xmm2
388 ; SSSE3-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
389 ; SSSE3-NEXT: psadbw %xmm1, %xmm0
395 ; SSE41-NEXT: pxor %xmm1, %xmm1
411 ; SSE41-NEXT: punpckhdq {{.*#+}} xmm2 = xmm2[2],xmm1[2],xmm2[3],xmm1[3]
412 ; SSE41-NEXT: psadbw %xmm1, %xmm2
413 ; SSE41-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
414 ; SSE41-NEXT: psadbw %xmm1, %xmm0
420 ; AVX1-NEXT: vpxor %xmm1, %xmm1, %xmm1
421 ; AVX1-NEXT: vpsubd %xmm0, %xmm1, %xmm2
432 ; AVX1-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
433 ; AVX1-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
434 ; AVX1-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
435 ; AVX1-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
441 ; AVX2-NEXT: vpxor %xmm1, %xmm1, %xmm1
442 ; AVX2-NEXT: vpsubd %xmm0, %xmm1, %xmm2
454 ; AVX2-NEXT: vpunpckhdq {{.*#+}} xmm2 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
455 ; AVX2-NEXT: vpsadbw %xmm1, %xmm2, %xmm2
456 ; AVX2-NEXT: vpunpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
457 ; AVX2-NEXT: vpsadbw %xmm1, %xmm0, %xmm0
467 ; SSE2-NEXT: pxor %xmm1, %xmm1
468 ; SSE2-NEXT: psubw %xmm0, %xmm1
469 ; SSE2-NEXT: pand %xmm0, %xmm1
470 ; SSE2-NEXT: psubw {{.*}}(%rip), %xmm1
471 ; SSE2-NEXT: movdqa %xmm1, %xmm0
474 ; SSE2-NEXT: psubw %xmm0, %xmm1
476 ; SSE2-NEXT: movdqa %xmm1, %xmm2
478 ; SSE2-NEXT: psrlw $2, %xmm1
479 ; SSE2-NEXT: pand %xmm0, %xmm1
480 ; SSE2-NEXT: paddw %xmm2, %xmm1
481 ; SSE2-NEXT: movdqa %xmm1, %xmm2
483 ; SSE2-NEXT: paddw %xmm1, %xmm2
493 ; SSE3-NEXT: pxor %xmm1, %xmm1
494 ; SSE3-NEXT: psubw %xmm0, %xmm1
495 ; SSE3-NEXT: pand %xmm0, %xmm1
496 ; SSE3-NEXT: psubw {{.*}}(%rip), %xmm1
497 ; SSE3-NEXT: movdqa %xmm1, %xmm0
500 ; SSE3-NEXT: psubw %xmm0, %xmm1
502 ; SSE3-NEXT: movdqa %xmm1, %xmm2
504 ; SSE3-NEXT: psrlw $2, %xmm1
505 ; SSE3-NEXT: pand %xmm0, %xmm1
506 ; SSE3-NEXT: paddw %xmm2, %xmm1
507 ; SSE3-NEXT: movdqa %xmm1, %xmm2
509 ; SSE3-NEXT: paddw %xmm1, %xmm2
519 ; SSSE3-NEXT: pxor %xmm1, %xmm1
520 ; SSSE3-NEXT: psubw %xmm0, %xmm1
521 ; SSSE3-NEXT: pand %xmm0, %xmm1
522 ; SSSE3-NEXT: psubw {{.*}}(%rip), %xmm1
524 ; SSSE3-NEXT: movdqa %xmm1, %xmm2
529 ; SSSE3-NEXT: psrlw $4, %xmm1
530 ; SSSE3-NEXT: pand %xmm0, %xmm1
531 ; SSSE3-NEXT: pshufb %xmm1, %xmm3
541 ; SSE41-NEXT: pxor %xmm1, %xmm1
542 ; SSE41-NEXT: psubw %xmm0, %xmm1
543 ; SSE41-NEXT: pand %xmm0, %xmm1
544 ; SSE41-NEXT: psubw {{.*}}(%rip), %xmm1
546 ; SSE41-NEXT: movdqa %xmm1, %xmm2
551 ; SSE41-NEXT: psrlw $4, %xmm1
552 ; SSE41-NEXT: pand %xmm0, %xmm1
553 ; SSE41-NEXT: pshufb %xmm1, %xmm3
563 ; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
564 ; AVX-NEXT: vpsubw %xmm0, %xmm1, %xmm1
565 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
567 ; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
568 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
572 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
575 ; AVX-NEXT: vpsllw $8, %xmm0, %xmm1
576 ; AVX-NEXT: vpaddb %xmm0, %xmm1, %xmm0
586 ; SSE2-NEXT: pxor %xmm1, %xmm1
587 ; SSE2-NEXT: psubw %xmm0, %xmm1
588 ; SSE2-NEXT: pand %xmm0, %xmm1
589 ; SSE2-NEXT: psubw {{.*}}(%rip), %xmm1
590 ; SSE2-NEXT: movdqa %xmm1, %xmm0
593 ; SSE2-NEXT: psubw %xmm0, %xmm1
595 ; SSE2-NEXT: movdqa %xmm1, %xmm2
597 ; SSE2-NEXT: psrlw $2, %xmm1
598 ; SSE2-NEXT: pand %xmm0, %xmm1
599 ; SSE2-NEXT: paddw %xmm2, %xmm1
600 ; SSE2-NEXT: movdqa %xmm1, %xmm2
602 ; SSE2-NEXT: paddw %xmm1, %xmm2
612 ; SSE3-NEXT: pxor %xmm1, %xmm1
613 ; SSE3-NEXT: psubw %xmm0, %xmm1
614 ; SSE3-NEXT: pand %xmm0, %xmm1
615 ; SSE3-NEXT: psubw {{.*}}(%rip), %xmm1
616 ; SSE3-NEXT: movdqa %xmm1, %xmm0
619 ; SSE3-NEXT: psubw %xmm0, %xmm1
621 ; SSE3-NEXT: movdqa %xmm1, %xmm2
623 ; SSE3-NEXT: psrlw $2, %xmm1
624 ; SSE3-NEXT: pand %xmm0, %xmm1
625 ; SSE3-NEXT: paddw %xmm2, %xmm1
626 ; SSE3-NEXT: movdqa %xmm1, %xmm2
628 ; SSE3-NEXT: paddw %xmm1, %xmm2
638 ; SSSE3-NEXT: pxor %xmm1, %xmm1
639 ; SSSE3-NEXT: psubw %xmm0, %xmm1
640 ; SSSE3-NEXT: pand %xmm0, %xmm1
641 ; SSSE3-NEXT: psubw {{.*}}(%rip), %xmm1
643 ; SSSE3-NEXT: movdqa %xmm1, %xmm2
648 ; SSSE3-NEXT: psrlw $4, %xmm1
649 ; SSSE3-NEXT: pand %xmm0, %xmm1
650 ; SSSE3-NEXT: pshufb %xmm1, %xmm3
660 ; SSE41-NEXT: pxor %xmm1, %xmm1
661 ; SSE41-NEXT: psubw %xmm0, %xmm1
662 ; SSE41-NEXT: pand %xmm0, %xmm1
663 ; SSE41-NEXT: psubw {{.*}}(%rip), %xmm1
665 ; SSE41-NEXT: movdqa %xmm1, %xmm2
670 ; SSE41-NEXT: psrlw $4, %xmm1
671 ; SSE41-NEXT: pand %xmm0, %xmm1
672 ; SSE41-NEXT: pshufb %xmm1, %xmm3
682 ; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
683 ; AVX-NEXT: vpsubw %xmm0, %xmm1, %xmm1
684 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
686 ; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
687 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
691 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
694 ; AVX-NEXT: vpsllw $8, %xmm0, %xmm1
695 ; AVX-NEXT: vpaddb %xmm0, %xmm1, %xmm0
705 ; SSE2-NEXT: pxor %xmm1, %xmm1
706 ; SSE2-NEXT: psubb %xmm0, %xmm1
707 ; SSE2-NEXT: pand %xmm0, %xmm1
708 ; SSE2-NEXT: psubb {{.*}}(%rip), %xmm1
709 ; SSE2-NEXT: movdqa %xmm1, %xmm0
712 ; SSE2-NEXT: psubb %xmm0, %xmm1
714 ; SSE2-NEXT: movdqa %xmm1, %xmm2
716 ; SSE2-NEXT: psrlw $2, %xmm1
717 ; SSE2-NEXT: pand %xmm0, %xmm1
718 ; SSE2-NEXT: paddb %xmm2, %xmm1
719 ; SSE2-NEXT: movdqa %xmm1, %xmm0
721 ; SSE2-NEXT: paddb %xmm1, %xmm0
727 ; SSE3-NEXT: pxor %xmm1, %xmm1
728 ; SSE3-NEXT: psubb %xmm0, %xmm1
729 ; SSE3-NEXT: pand %xmm0, %xmm1
730 ; SSE3-NEXT: psubb {{.*}}(%rip), %xmm1
731 ; SSE3-NEXT: movdqa %xmm1, %xmm0
734 ; SSE3-NEXT: psubb %xmm0, %xmm1
736 ; SSE3-NEXT: movdqa %xmm1, %xmm2
738 ; SSE3-NEXT: psrlw $2, %xmm1
739 ; SSE3-NEXT: pand %xmm0, %xmm1
740 ; SSE3-NEXT: paddb %xmm2, %xmm1
741 ; SSE3-NEXT: movdqa %xmm1, %xmm0
743 ; SSE3-NEXT: paddb %xmm1, %xmm0
749 ; SSSE3-NEXT: pxor %xmm1, %xmm1
750 ; SSSE3-NEXT: psubb %xmm0, %xmm1
751 ; SSSE3-NEXT: pand %xmm0, %xmm1
752 ; SSSE3-NEXT: psubb {{.*}}(%rip), %xmm1
754 ; SSSE3-NEXT: movdqa %xmm1, %xmm3
759 ; SSSE3-NEXT: psrlw $4, %xmm1
760 ; SSSE3-NEXT: pand %xmm2, %xmm1
761 ; SSSE3-NEXT: pshufb %xmm1, %xmm0
767 ; SSE41-NEXT: pxor %xmm1, %xmm1
768 ; SSE41-NEXT: psubb %xmm0, %xmm1
769 ; SSE41-NEXT: pand %xmm0, %xmm1
770 ; SSE41-NEXT: psubb {{.*}}(%rip), %xmm1
772 ; SSE41-NEXT: movdqa %xmm1, %xmm3
777 ; SSE41-NEXT: psrlw $4, %xmm1
778 ; SSE41-NEXT: pand %xmm2, %xmm1
779 ; SSE41-NEXT: pshufb %xmm1, %xmm0
785 ; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
786 ; AVX-NEXT: vpsubb %xmm0, %xmm1, %xmm1
787 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
789 ; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
790 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
794 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
805 ; SSE2-NEXT: pxor %xmm1, %xmm1
806 ; SSE2-NEXT: psubb %xmm0, %xmm1
807 ; SSE2-NEXT: pand %xmm0, %xmm1
808 ; SSE2-NEXT: psubb {{.*}}(%rip), %xmm1
809 ; SSE2-NEXT: movdqa %xmm1, %xmm0
812 ; SSE2-NEXT: psubb %xmm0, %xmm1
814 ; SSE2-NEXT: movdqa %xmm1, %xmm2
816 ; SSE2-NEXT: psrlw $2, %xmm1
817 ; SSE2-NEXT: pand %xmm0, %xmm1
818 ; SSE2-NEXT: paddb %xmm2, %xmm1
819 ; SSE2-NEXT: movdqa %xmm1, %xmm0
821 ; SSE2-NEXT: paddb %xmm1, %xmm0
827 ; SSE3-NEXT: pxor %xmm1, %xmm1
828 ; SSE3-NEXT: psubb %xmm0, %xmm1
829 ; SSE3-NEXT: pand %xmm0, %xmm1
830 ; SSE3-NEXT: psubb {{.*}}(%rip), %xmm1
831 ; SSE3-NEXT: movdqa %xmm1, %xmm0
834 ; SSE3-NEXT: psubb %xmm0, %xmm1
836 ; SSE3-NEXT: movdqa %xmm1, %xmm2
838 ; SSE3-NEXT: psrlw $2, %xmm1
839 ; SSE3-NEXT: pand %xmm0, %xmm1
840 ; SSE3-NEXT: paddb %xmm2, %xmm1
841 ; SSE3-NEXT: movdqa %xmm1, %xmm0
843 ; SSE3-NEXT: paddb %xmm1, %xmm0
849 ; SSSE3-NEXT: pxor %xmm1, %xmm1
850 ; SSSE3-NEXT: psubb %xmm0, %xmm1
851 ; SSSE3-NEXT: pand %xmm0, %xmm1
852 ; SSSE3-NEXT: psubb {{.*}}(%rip), %xmm1
854 ; SSSE3-NEXT: movdqa %xmm1, %xmm3
859 ; SSSE3-NEXT: psrlw $4, %xmm1
860 ; SSSE3-NEXT: pand %xmm2, %xmm1
861 ; SSSE3-NEXT: pshufb %xmm1, %xmm0
867 ; SSE41-NEXT: pxor %xmm1, %xmm1
868 ; SSE41-NEXT: psubb %xmm0, %xmm1
869 ; SSE41-NEXT: pand %xmm0, %xmm1
870 ; SSE41-NEXT: psubb {{.*}}(%rip), %xmm1
872 ; SSE41-NEXT: movdqa %xmm1, %xmm3
877 ; SSE41-NEXT: psrlw $4, %xmm1
878 ; SSE41-NEXT: pand %xmm2, %xmm1
879 ; SSE41-NEXT: pshufb %xmm1, %xmm0
885 ; AVX-NEXT: vpxor %xmm1, %xmm1, %xmm1
886 ; AVX-NEXT: vpsubb %xmm0, %xmm1, %xmm1
887 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0
889 ; AVX-NEXT: vmovdqa {{.*#+}} xmm1 = [15,15,15,15,15,15,15,15,15,15,15,15,15,15,15,15]
890 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm2
894 ; AVX-NEXT: vpand %xmm1, %xmm0, %xmm0