Lines Matching refs:m0
242 %%load m0, [%2q ]
257 punpcklbw m0, m1
265 punpcklwd m0, m1
291 %%load m0, [%2-3*%%stride] ;load data from source
307 punpcklbw m0, m1
319 punpcklwd m0, m1
330 movu m0, [%5q ] ;load x- 3*srcstride
345 punpcklbw m0, m1
357 punpcklwd m0, m1
461 vextracti128 xm1, m0, 1
465 pmovzxbw m0, xm0
468 punpckhbw m1, m0, m2
471 punpcklbw m0, m2
474 psllw m0, 14-%2
477 %macro EPEL_COMPUTE 4-8 ; bitdepth, width, filter1, filter2, HV/m0, m2, m1, m3
484 %define %%reg0 m0
492 vperm2i128 m10, m0, m1, q0301
494 vinserti128 m0, m0, xm1, 1
546 pmaddubsw m0, [rfilterq + %3q*8 ] ;x1*c1+x2*c2
550 paddw m0, m2
552 paddw m0, m4
554 pmaddwd m0, [rfilterq + %3q*8 ]
558 paddd m0, m2
560 paddd m0, m4
562 psrad m0, %2-8
576 p%4 m0, m1
584 vperm2i128 m10, m0, m1, q0301
585 vinserti128 m0, m0, xm1, 1
602 pmaddubsw m0, m12 ;x1*c1+x2*c2
606 paddw m0, m2
608 paddw m0, m4
619 pmaddwd m0, m12
623 paddd m0, m2
625 paddd m0, m4
627 psrad m0, %2-8
688 SIMPLE_LOAD %1, %2, srcq, m0
690 PEL_10STORE%1 dstq, m0, m1
698 SIMPLE_LOAD %1, %2, srcq, m0
699 PEL_%2STORE%1 dstq, m0, m1
712 SIMPLE_LOAD %1, %2, srcq, m0
715 BI_COMPUTE %1, %2, m0, m1, m3, m4, m5, 1
716 PEL_%2STORE%1 dstq, m0, m1
746 PEL_10STORE%1 dstq, m0, m1
757 UNI_COMPUTE %1, %2, m0, m1, m6
758 PEL_%2STORE%1 dstq, m0, m1
772 BI_COMPUTE %1, %2, m0, m1, m2, m3, m6, 1
773 PEL_%2STORE%1 dstq, m0, m1
795 PEL_10STORE%1 dstq, m0, m1
808 UNI_COMPUTE %1, %2, m0, m1, m6
809 PEL_%2STORE%1 dstq, m0, m1
827 BI_COMPUTE %1, %2, m0, m1, m2, m3, m6, 1
828 PEL_%2STORE%1 dstq, m0, m1
854 SWAP m4, m0
861 SWAP m5, m0
868 SWAP m6, m0
876 SWAP m7, m0
877 punpcklwd m0, m4, m5
891 vinserti128 m2, m0, xm4, 1
892 vperm2i128 m3, m0, m4, q0301
895 PEL_10STORE%1 dstq, m0, m4
898 PEL_10STORE%1 dstq, m0, m1
920 SWAP m4, m0
927 SWAP m5, m0
934 SWAP m6, m0
942 mova m7, m0
943 punpcklwd m0, m4, m5
956 UNI_COMPUTE %1, %2, m0, m4, [pw_%2]
958 UNI_COMPUTE %1, %2, m0, m1, [pw_%2]
960 PEL_%2STORE%1 dstq, m0, m1
984 SWAP m4, m0
991 SWAP m5, m0
998 SWAP m6, m0
1006 SWAP m7, m0
1007 punpcklwd m0, m4, m5
1024 BI_COMPUTE %1, %2, m0, m4, m1, m2, [pw_bi_%2]
1026 BI_COMPUTE %1, %2, m0, m4, m8, m3, [pw_bi_%2]
1030 BI_COMPUTE %1, %2, m0, m1, m8, m9, [pw_bi_%2]
1032 PEL_%2STORE%1 dstq, m0, m4
1062 packssdw m0, m1
1064 PEL_10STORE%1 dstq, m0, m1
1075 packssdw m0, m1
1077 UNI_COMPUTE %1, %2, m0, m1, m9
1078 PEL_%2STORE%1 dstq, m0, m1
1092 packssdw m0, m1
1095 BI_COMPUTE %1, %2, m0, m1, m10, m11, m9, 1
1096 PEL_%2STORE%1 dstq, m0, m1
1119 packssdw m0, m1
1121 PEL_10STORE%1 dstq, m0, m1
1134 packssdw m0, m1
1136 UNI_COMPUTE %1, %2, m0, m1, m9
1137 PEL_%2STORE%1 dstq, m0, m1
1153 packssdw m0, m1
1156 BI_COMPUTE %1, %2, m0, m1, m10, m11, m9, 1
1157 PEL_%2STORE%1 dstq, m0, m1
1187 SWAP m8, m0
1191 SWAP m9, m0
1195 SWAP m10, m0
1199 SWAP m11, m0
1203 SWAP m12, m0
1207 SWAP m13, m0
1211 SWAP m14, m0
1216 SWAP m15, m0
1217 punpcklwd m0, m8, m9
1228 PEL_10STORE%1 dstq, m0, m1
1263 SWAP m8, m0
1267 SWAP m9, m0
1271 SWAP m10, m0
1275 SWAP m11, m0
1279 SWAP m12, m0
1283 SWAP m13, m0
1287 SWAP m14, m0
1292 SWAP m15, m0
1293 punpcklwd m0, m8, m9
1304 UNI_COMPUTE %1, %2, m0, m1, [pw_%2]
1305 PEL_%2STORE%1 dstq, m0, m1
1344 SWAP m8, m0
1348 SWAP m9, m0
1352 SWAP m10, m0
1356 SWAP m11, m0
1360 SWAP m12, m0
1364 SWAP m13, m0
1368 SWAP m14, m0
1373 SWAP m15, m0
1374 punpcklwd m0, m8, m9
1386 BI_COMPUTE %1, %2, m0, m1, m8, m9, [pw_bi_%2]
1387 PEL_%2STORE%1 dstq, m0, m1
1449 SIMPLE_LOAD %1, 10, srcq, m0
1451 punpcklwd m0, m1
1452 pmaddwd m0, m2
1453 paddd m0, m5
1454 psrad m0, m4
1455 paddd m0, m3
1457 pmulhw m6, m0, m2
1458 pmullw m0, m2
1459 punpckhwd m1, m0, m6
1460 punpcklwd m0, m6
1461 paddd m0, m5
1463 psrad m0, m4
1465 paddd m0, m3
1468 packssdw m0, m1
1470 packuswb m0, m0
1472 CLIPW m0, [pb_0], [max_pixels_%2]
1474 PEL_%2STORE%1 dstq, m0, m1
1489 movd m0, r5d ; shift
1515 pslld m4, m0
1518 SIMPLE_LOAD %1, 10, srcq, m0
1521 punpcklwd m0, m1
1523 pmaddwd m0, m3
1525 paddd m0, m4
1526 paddd m0, m8
1527 psrad m0, m5
1529 pmulhw m6, m0, m3
1530 pmullw m0, m3
1533 punpckhwd m1, m0, m6
1534 punpcklwd m0, m6
1537 paddd m0, m8
1539 paddd m0, m4
1541 psrad m0, m5
1544 packssdw m0, m1
1546 packuswb m0, m0
1548 CLIPW m0, [pb_0], [max_pixels_%2]
1550 PEL_%2STORE%1 dstq, m0, m1
1654 INIT_YMM avx2 ; adds ff_ and _avx2 to function name & enables 256b registers : m0 for 256b, xm0 fo…