Lines Matching refs:p_src
1954 %define p_src r0
1977 sub p_src, i_srcstride
1978 sub p_src, i_srcstride
1984 movd xmm0, [p_src]
1985 movd xmm4, [p_src + i_srcstride]
1987 movd xmm1, [p_src + 2 * i_srcstride]
1990 movd xmm4, [p_src + i_srcstride3]
1991 lea p_src, [p_src + 4 * i_srcstride]
1993 movd xmm2, [p_src]
1996 movd xmm4, [p_src + i_srcstride]
1997 lea p_src, [p_src + 2 * i_srcstride]
1999 movd xmm3, [p_src]
2009 movd xmm4, [p_src + i_srcstride]
2011 movd xmm0, [p_src + 2 * i_srcstride]
2022 movd xmm4, [p_src + i_srcstride3]
2037 lea p_src, [p_src + 4 * i_srcstride]
2038 movd xmm1, [p_src]
2047 movd xmm4, [p_src + i_srcstride]
2049 movd xmm2, [p_src + 2 * i_srcstride]
2060 movd xmm4, [p_src + i_srcstride3]
2082 push p_src
2087 movq xmm0, [p_src]
2088 movq xmm1, [p_src + i_srcstride]
2090 movq xmm2, [p_src + 2 * i_srcstride]
2091 movq xmm3, [p_src + i_srcstride3]
2092 lea p_src, [p_src + 4 * i_srcstride]
2094 movq xmm4, [p_src]
2095 movq xmm5, [p_src + i_srcstride]
2096 lea p_src, [p_src + 2 * i_srcstride]
2104 movq xmm1, [p_src]
2105 movq xmm2, [p_src + i_srcstride]
2106 movq xmm3, [p_src + 2 * i_srcstride]
2107 add p_src, i_srcstride3
2109 movq xmm4, [p_src]
2110 movq xmm5, [p_src + i_srcstride]
2111 lea p_src, [p_src + 2 * i_srcstride]
2114 movq xmm6, [p_src]
2116 movq xmm7, [p_src + i_srcstride]
2123 movq xmm0, [p_src + 2 * i_srcstride]
2125 movq xmm1, [p_src + i_srcstride3]
2126 lea p_src, [p_src + 4 * i_srcstride]
2135 movq xmm2, [p_src]
2137 movq xmm3, [p_src + i_srcstride]
2144 movq xmm4, [p_src + 2 * i_srcstride]
2146 movq xmm5, [p_src + i_srcstride3]
2147 lea p_src, [p_src + 4 * i_srcstride]
2158 pop p_src
2162 add p_src, 8
2176 %undef p_src
2196 %define p_src r0
2217 movdqu xmm0, [p_src - 2]
2218 movdqu xmm1, [p_src + i_srcstride - 2]
2219 lea p_src, [p_src + 2 * i_srcstride]
2233 movdqu xmm0, [p_src - 2]
2234 movdqu xmm1, [p_src + i_srcstride - 2]
2235 lea p_src, [p_src + 2 * i_srcstride]
2249 movdqu xmm0, [p_src - 2]
2250 movdqu xmm1, [p_src + 6]
2251 add p_src, i_srcstride
2263 %undef p_src
2281 %define p_src r0
2302 movdqu xmm0, [p_src - 2]
2303 add p_src, i_srcstride
2318 movdqu xmm0, [p_src - 2]
2319 movdqu xmm4, [p_src + i_srcstride - 2]
2320 lea p_src, [p_src + 2 * i_srcstride]
2342 movdqu xmm0, [p_src - 2]
2343 movdqu xmm3, [p_src + 6]
2344 add p_src, i_srcstride
2349 movdqu xmm1, [p_src - 2]
2350 movdqu xmm3, [p_src + 6]
2351 add p_src, i_srcstride
2371 %undef p_src
2387 %define p_src r0
2397 sub p_src, i_srcstride
2398 sub p_src, i_srcstride
2404 movdqu xmm0, [p_src - 2]
2405 movdqu xmm1, [p_src + i_srcstride - 2]
2406 lea p_src, [p_src + 2 * i_srcstride]
2413 movdqu xmm0, [p_src - 2]
2420 %undef p_src
2434 %define p_src r0
2445 movdqa xmm0, [p_src + 0 * i_srcstride]
2446 movdqu xmm1, [p_src + 1 * i_srcstride]
2447 movdqa xmm2, [p_src + 2 * i_srcstride]
2448 movdqu xmm3, [p_src + 3 * i_srcstride]
2449 movdqa xmm4, [p_src + 4 * i_srcstride]
2450 movdqu xmm5, [p_src + 5 * i_srcstride]
2451 movdqa xmm6, [p_src + 6 * i_srcstride]
2458 movdqu xmm7, [p_src + 7 * i_srcstride]
2459 movdqa xmm0, [p_src + 8 * i_srcstride]
2468 movdqu xmm1, [p_src + 9 * i_srcstride]
2469 movdqa xmm2, [p_src + 10 * i_srcstride]
2476 movdqu xmm3, [p_src + 11 * i_srcstride]
2487 %undef p_src
2503 %define p_src r0
2515 sub p_src, i_srcstride
2516 sub p_src, i_srcstride
2522 movdqu xmm0, [p_src - 2]
2523 movdqu xmm1, [p_src + i_srcstride - 2]
2524 lea p_src, [p_src + 2 * i_srcstride]
2534 movdqu xmm0, [p_src - 2]
2542 %undef p_src
2558 %define p_src r0
2576 movdqa xmm0, [p_src]
2577 movdqa xmm1, [p_src + i_srcstride]
2578 movdqa xmm2, [p_src + 2 * i_srcstride]
2579 movdqa xmm3, [p_src + i_srcstride3]
2580 lea p_src, [p_src + 4 * i_srcstride]
2581 movdqa xmm4, [p_src]
2582 movdqa xmm5, [p_src + i_srcstride]
2584 movdqa xmm6, [p_src + 2 * i_srcstride]
2592 movdqa xmm7, [p_src + i_srcstride3]
2593 lea p_src, [p_src + 4 * i_srcstride]
2601 movdqa xmm0, [p_src]
2615 movdqa xmm1, [p_src + i_srcstride]
2625 movdqa xmm2, [p_src + 2 * i_srcstride]
2627 movdqa xmm3, [p_src + i_srcstride3]
2628 lea p_src, [p_src + 4 * i_srcstride]
2636 movdqa xmm4, [p_src]
2650 movdqa xmm5, [p_src + i_srcstride]
2665 %undef p_src
2683 %define p_src r0
2697 sub p_src, i_srcstride
2698 sub p_src, i_srcstride
2708 movdqu xmm0, [p_src - 2]
2711 movdqu xmm2, [p_src + i_srcstride - 2]
2712 lea p_src, [p_src + 2 * i_srcstride]
2730 movdqu xmm0, [p_src - 2]
2731 movdqu xmm3, [p_src + 6]
2732 add p_src, i_srcstride
2737 movdqu xmm2, [p_src + 6]
2740 movdqu xmm1, [p_src - 2]
2741 add p_src, i_srcstride
2757 %undef p_src
2775 %define p_src r0
2804 push p_src
2808 add p_src, i_width
2809 add p_src, i_width
2810 sub p_src, 2
2812 lea p_src, [p_src + 2 * i_width - 2]
2815 movd xmm0, [p_src]
2816 punpcklwd xmm0, [p_src + i_srcstride]
2817 movd xmm1, [p_src + 2 * i_srcstride]
2818 add p_src, i_srcstride3
2819 punpcklwd xmm1, [p_src]
2821 movd xmm1, [p_src + i_srcstride]
2824 punpcklwd xmm1, [p_src + 2 * i_srcstride]
2825 movd xmm2, [p_src + i_srcstride3]
2826 lea p_src, [p_src + 4 * i_srcstride]
2827 punpcklwd xmm2, [p_src]
2831 movd xmm1, [p_src + i_srcstride]
2833 movd xmm2, [p_src + 2 * i_srcstride]
2835 movd xmm3, [p_src + i_srcstride3]
2837 lea p_src, [p_src + 4 * i_srcstride]
2838 movd xmm4, [p_src]
2840 movd xmm5, [p_src + i_srcstride]
2864 movd xmm1, [p_src + 2 * i_srcstride]
2866 movd xmm0, [p_src + i_srcstride3]
2867 lea p_src, [p_src + 4 * i_srcstride]
2868 punpcklwd xmm0, [p_src]
2872 movddup xmm6, [p_src + 2 * i_srcstride - 6]
2880 movd xmm2, [p_src + 2 * i_srcstride]
2882 movd xmm3, [p_src + i_srcstride3]
2883 lea p_src, [p_src + 4 * i_srcstride]
2885 movd xmm4, [p_src]
2887 movd xmm5, [p_src + i_srcstride]
2889 movd xmm6, [p_src + 2 * i_srcstride]
2907 pop p_src
2912 push p_src
2915 movdqa xmm0, [p_src]
2916 movdqa xmm1, [p_src + i_srcstride]
2917 movdqa xmm2, [p_src + 2 * i_srcstride]
2918 movdqa xmm3, [p_src + i_srcstride3]
2919 lea p_src, [p_src + 4 * i_srcstride]
2920 movdqa xmm4, [p_src]
2922 movdqa xmm5, [p_src + i_srcstride]
2924 movdqa xmm6, [p_src + 2 * i_srcstride]
2926 movdqa xmm7, [p_src + i_srcstride3]
2927 lea p_src, [p_src + 4 * i_srcstride]
2933 movdqa xmm0, [p_src]
2941 movdqa xmm1, [p_src + i_srcstride]
2944 movdqa xmm2, [p_src + 2 * i_srcstride]
2946 movdqa xmm3, [p_src + i_srcstride3]
2947 lea p_src, [p_src + 4 * i_srcstride]
2953 movdqa xmm4, [p_src]
2962 movdqa xmm5, [p_src + i_srcstride]
2968 pop p_src
2973 add p_src, 16
2980 pop p_src
2991 %undef p_src
3108 %define p_src r0
3131 sub p_src, i_srcstride
3132 sub p_src, i_srcstride
3138 vmovd xmm0, [p_src]
3139 vpbroadcastd xmm5, [p_src + i_srcstride]
3141 vpbroadcastd ymm1, [p_src + 2 * i_srcstride]
3144 vpbroadcastd ymm5, [p_src + i_srcstride3]
3145 lea p_src, [p_src + 4 * i_srcstride]
3147 vpbroadcastd ymm2, [p_src]
3151 vpbroadcastd ymm5, [p_src + i_srcstride]
3152 lea p_src, [p_src + 2 * i_srcstride]
3154 vpbroadcastd ymm3, [p_src]
3158 vpbroadcastd ymm5, [p_src + i_srcstride]
3160 vpbroadcastd ymm4, [p_src + 2 * i_srcstride]
3178 vpbroadcastd ymm5, [p_src + i_srcstride3]
3186 lea p_src, [p_src + 4 * i_srcstride]
3187 vpbroadcastd ymm1, [p_src]
3191 vpbroadcastd ymm5, [p_src + i_srcstride]
3193 vpbroadcastd ymm0, [p_src + 2 * i_srcstride]
3210 vmovd xmm5, [p_src + i_srcstride3]
3227 vmovq xmm0, [p_src]
3228 vmovq xmm4, [p_src + i_srcstride]
3230 vmovq xmm1, [p_src + 2 * i_srcstride]
3233 vmovq xmm4, [p_src + i_srcstride3]
3234 lea p_src, [p_src + 4 * i_srcstride]
3236 vmovq xmm6, [p_src]
3240 vmovq xmm4, [p_src + i_srcstride]
3242 vmovq xmm3, [p_src + 2 * i_srcstride]
3247 vmovq xmm4, [p_src + i_srcstride3]
3248 lea p_src, [p_src + 4 * i_srcstride]
3250 vmovq xmm6, [p_src]
3264 vmovq xmm4, [p_src + i_srcstride]
3272 vmovq xmm1, [p_src + 2 * i_srcstride]
3276 vmovq xmm4, [p_src + i_srcstride3]
3277 lea p_src, [p_src + 4 * i_srcstride]
3279 vmovq xmm6, [p_src]
3294 vmovq xmm4, [p_src + i_srcstride]
3313 vmovq xmm0, [p_src]
3314 vpbroadcastq ymm1, [p_src + 8]
3316 vmovq xmm1, [p_src + i_srcstride]
3317 vpbroadcastq ymm2, [p_src + i_srcstride + 8]
3320 vmovq xmm2, [p_src + 2 * i_srcstride]
3321 vpbroadcastq ymm3, [p_src + 2 * i_srcstride + 8]
3323 vmovq xmm3, [p_src + i_srcstride3]
3324 vpbroadcastq ymm4, [p_src + i_srcstride3 + 8]
3325 lea p_src, [p_src + 4 * i_srcstride]
3328 vmovq xmm4, [p_src]
3329 vpbroadcastq ymm5, [p_src + 8]
3331 vmovq xmm5, [p_src + i_srcstride]
3332 vpbroadcastq ymm6, [p_src + i_srcstride + 8]
3333 lea p_src, [p_src + 2 * i_srcstride]
3343 vmovq xmm1, [p_src]
3344 vpbroadcastq ymm2, [p_src + 8]
3346 vmovq xmm2, [p_src + i_srcstride]
3347 vpbroadcastq ymm3, [p_src + i_srcstride + 8]
3349 vmovq xmm3, [p_src + 2 * i_srcstride]
3350 vpbroadcastq ymm4, [p_src + 2 * i_srcstride + 8]
3351 add p_src, i_srcstride3
3354 vmovq xmm4, [p_src]
3355 vpbroadcastq ymm5, [p_src + 8]
3357 vmovq xmm5, [p_src + i_srcstride]
3358 vpbroadcastq ymm6, [p_src + i_srcstride + 8]
3359 lea p_src, [p_src + 2 * i_srcstride]
3363 vmovq xmm6, [p_src]
3364 vpbroadcastq ymm7, [p_src + 8]
3367 vmovq xmm7, [p_src + i_srcstride]
3368 vpbroadcastq ymm0, [p_src + i_srcstride + 8]
3377 vmovq xmm0, [p_src + 2 * i_srcstride]
3378 vpbroadcastq ymm1, [p_src + 2 * i_srcstride + 8]
3381 vmovq xmm1, [p_src + i_srcstride3]
3382 vpbroadcastq ymm2, [p_src + i_srcstride3 + 8]
3383 lea p_src, [p_src + 4 * i_srcstride]
3392 vmovq xmm2, [p_src]
3393 vpbroadcastq ymm3, [p_src + 8]
3396 vmovq xmm3, [p_src + i_srcstride]
3397 vpbroadcastq ymm4, [p_src + i_srcstride + 8]
3406 vmovq xmm4, [p_src + 2 * i_srcstride]
3407 vpbroadcastq ymm5, [p_src + 2 * i_srcstride + 8]
3410 vmovq xmm5, [p_src + i_srcstride3]
3411 vpbroadcastq ymm6, [p_src + i_srcstride3 + 8]
3412 lea p_src, [p_src + 4 * i_srcstride]
3431 %undef p_src
3451 %define p_src r0
3475 vmovdqu xmm0, [p_src - 2]
3476 vmovdqu xmm1, [p_src + i_srcstride - 2]
3477 vinserti128 ymm0, ymm0, [p_src + 2 * i_srcstride - 2], 1
3478 vinserti128 ymm1, ymm1, [p_src + i_srcstride3 - 2], 1
3479 lea p_src, [p_src + 4 * i_srcstride]
3501 vmovdqu xmm0, [p_src - 2]
3502 vmovdqu xmm1, [p_src + i_srcstride - 2]
3503 vinserti128 ymm0, ymm0, [p_src + 2 * i_srcstride - 2], 1
3504 vinserti128 ymm1, ymm1, [p_src + i_srcstride3 - 2], 1
3505 lea p_src, [p_src + 4 * i_srcstride]
3525 vmovdqu xmm0, [p_src - 2]
3526 vmovdqu xmm1, [p_src + 6]
3527 vinserti128 ymm0, ymm0, [p_src + i_srcstride - 2], 1
3528 vinserti128 ymm1, ymm1, [p_src + i_srcstride + 6], 1
3529 lea p_src, [p_src + 2 * i_srcstride]
3543 %undef p_src
3561 %define p_src r0
3582 vmovdqu xmm0, [p_src - 2]
3583 vinserti128 ymm0, ymm0, [p_src + i_srcstride - 2], 1
3584 lea p_src, [p_src + 2 * i_srcstride]
3608 vmovdqu xmm0, [p_src - 2]
3609 vmovdqu xmm4, [p_src + i_srcstride - 2]
3610 vinserti128 ymm0, ymm0, [p_src + 2 * i_srcstride - 2], 1
3611 vinserti128 ymm4, ymm4, [p_src + i_srcstride3 - 2], 1
3612 lea p_src, [p_src + 4 * i_srcstride]
3645 vmovdqu xmm0, [p_src - 2]
3646 vmovdqu xmm3, [p_src + 6]
3647 vinserti128 ymm0, ymm0, [p_src + i_srcstride - 2], 1
3648 vinserti128 ymm3, ymm3, [p_src + i_srcstride + 6], 1
3653 vmovdqu xmm1, [p_src + 2 * i_srcstride - 2]
3654 vmovdqu xmm3, [p_src + 2 * i_srcstride + 6]
3655 vinserti128 ymm1, ymm1, [p_src + i_srcstride3 - 2], 1
3656 vinserti128 ymm3, ymm3, [p_src + i_srcstride3 + 6], 1
3657 lea p_src, [p_src + 4 * i_srcstride]
3687 %undef p_src
3703 %define p_src r0
3719 sub p_src, i_srcstride
3720 sub p_src, i_srcstride
3727 vmovdqu xmm0, [p_src - 2]
3728 vmovdqu xmm1, [p_src + i_srcstride - 2]
3729 vinserti128 ymm0, ymm0, [p_src + 2 * i_srcstride - 2], 1
3730 vinserti128 ymm1, ymm1, [p_src + i_srcstride3 - 2], 1
3731 lea p_src, [p_src + 4 * i_srcstride]
3738 vmovdqu xmm0, [p_src - 2]
3749 %undef p_src
3765 %define p_src r0
3782 vmovdqu ymm0, [p_src + 0 * i_srcstride]
3783 vmovdqu ymm1, [p_src + 1 * i_srcstride]
3784 vmovdqu ymm2, [p_src + 2 * i_srcstride]
3785 vmovdqu ymm3, [p_src + 3 * i_srcstride]
3786 vmovdqu ymm4, [p_src + 4 * i_srcstride]
3787 vmovdqu ymm5, [p_src + 5 * i_srcstride]
3788 vmovdqu ymm6, [p_src + 6 * i_srcstride]
3801 vmovdqu ymm7, [p_src + 7 * i_srcstride]
3802 vmovdqu ymm0, [p_src + 8 * i_srcstride]
3803 vmovdqu ymm1, [p_src + 9 * i_srcstride]
3822 %undef p_src
3838 %define p_src r0
3849 sub p_src, i_srcstride
3850 sub p_src, i_srcstride
3856 vmovdqu xmm0, [p_src - 2]
3857 vinserti128 ymm0, ymm0, [p_src + i_srcstride - 2], 1
3858 lea p_src, [p_src + 2 * i_srcstride]
3865 vmovdqu xmm0, [p_src - 2]
3874 %undef p_src
3889 %define p_src r0
3900 vmovdqu ymm0, [p_src + 0 * i_srcstride]
3901 vmovdqu ymm2, [p_src + 2 * i_srcstride]
3902 vmovdqu ymm4, [p_src + 4 * i_srcstride]
3903 vmovdqu ymm6, [p_src + 6 * i_srcstride]
3918 vmovdqu ymm7, [p_src + 7 * i_srcstride]
3919 vmovdqu ymm0, [p_src + 8 * i_srcstride]
3931 vmovdqu ymm1, [p_src + 9 * i_srcstride]
3932 vmovdqu ymm2, [p_src + 10 * i_srcstride]
3946 vmovdqu ymm3, [p_src + 11 * i_srcstride]
3947 vmovdqu xmm4, [p_src + 12 * i_srcstride]
3959 vmovdqu xmm5, [p_src + 13 * i_srcstride]
3971 %undef p_src
3986 %define p_src r0
4003 vmovdqa ymm0, [p_src + 0 * i_srcstride]
4004 vmovdqa ymm2, [p_src + 2 * i_srcstride]
4005 vmovdqa ymm4, [p_src + 4 * i_srcstride]
4009 vmovdqa ymm6, [p_src + 6 * i_srcstride]
4012 vmovdqu ymm7, [p_src + 7 * i_srcstride]
4015 vmovdqa ymm0, [p_src + 8 * i_srcstride]
4024 vmovdqu ymm1, [p_src + 9 * i_srcstride]
4025 vmovdqa ymm2, [p_src + 10 * i_srcstride]
4027 vmovdqu ymm3, [p_src + 11 * i_srcstride]
4030 vmovdqa ymm4, [p_src + 12 * i_srcstride]
4031 add p_src, 8 * i_srcstride
4049 %undef p_src
4065 %define p_src r0
4076 sub p_src, i_srcstride
4077 sub p_src, i_srcstride
4083 vmovdqu xmm0, [p_src - 2]
4084 vinserti128 ymm0, ymm0, [p_src + 6], 1
4085 vmovdqu xmm1, [p_src + i_srcstride - 2]
4086 vinserti128 ymm1, ymm1, [p_src + i_srcstride + 6], 1
4087 lea p_src, [p_src + 2 * i_srcstride]
4096 vmovdqu xmm0, [p_src - 2]
4097 vinserti128 ymm0, ymm0, [p_src + 6], 1
4106 %undef p_src
4121 %define p_src r0
4132 vmovdqa ymm0, [p_src + 0 * i_srcstride]
4133 vmovdqa ymm1, [p_src + 1 * i_srcstride]
4134 vmovdqa ymm2, [p_src + 2 * i_srcstride]
4135 vmovdqa ymm3, [p_src + 3 * i_srcstride]
4136 vmovdqa ymm4, [p_src + 4 * i_srcstride]
4139 vmovdqa ymm5, [p_src + 5 * i_srcstride]
4141 vmovdqa ymm6, [p_src + 6 * i_srcstride]
4143 vmovdqa ymm7, [p_src + 7 * i_srcstride]
4154 vmovdqa ymm0, [p_src + 8 * i_srcstride]
4165 vmovdqa ymm1, [p_src + 9 * i_srcstride]
4167 vmovdqa ymm2, [p_src + 10 * i_srcstride]
4169 vmovdqa ymm3, [p_src + 11 * i_srcstride]
4182 vmovdqa ymm4, [p_src + 12 * i_srcstride]
4183 add p_src, 8 * i_srcstride
4196 vmovdqa ymm5, [p_src + 5 * i_srcstride]
4209 %undef p_src
4224 %define p_src r0
4240 sub p_src, i_srcstride
4241 sub p_src, i_srcstride
4248 vmovdqu xmm0, [p_src - 2]
4249 vmovdqu xmm3, [p_src + 6]
4250 vinserti128 ymm0, ymm0, [p_src + i_srcstride - 2], 1
4251 vinserti128 ymm3, ymm3, [p_src + i_srcstride + 6], 1
4257 vmovdqu xmm1, [p_src + 2 * i_srcstride - 2]
4258 vmovdqu xmm0, [p_src + 2 * i_srcstride + 6]
4259 vinserti128 ymm1, ymm1, [p_src + i_srcstride3 - 2], 1
4260 vinserti128 ymm0, ymm0, [p_src + i_srcstride3 + 6], 1
4261 lea p_src, [p_src + 4 * i_srcstride]
4281 vmovdqu xmm0, [p_src - 2]
4282 vinserti128 ymm0, ymm0, [p_src + 6], 1
4283 vmovdqu xmm3, [p_src + i_srcstride - 2]
4284 vinserti128 ymm3, ymm3, [p_src + i_srcstride + 6], 1
4302 %undef p_src
4320 %define p_src r0
4348 push p_src
4352 add p_src, i_width
4353 add p_src, i_width
4354 sub p_src, 2
4356 lea p_src, [p_src + 2 * i_width - 2]
4359 vmovd xmm0, [p_src]
4360 vpunpcklwd xmm0, xmm0, [p_src + i_srcstride]
4361 vmovd xmm1, [p_src + 2 * i_srcstride]
4362 add p_src, i_srcstride3
4363 vpunpcklwd xmm1, xmm1, [p_src]
4365 vmovd xmm1, [p_src + i_srcstride]
4366 vpunpcklwd xmm1, xmm1, [p_src + 2 * i_srcstride]
4367 vmovd xmm2, [p_src + i_srcstride3]
4368 lea p_src, [p_src + 4 * i_srcstride]
4369 vpunpcklwd xmm2, xmm2, [p_src]
4373 vmovd xmm1, [p_src + i_srcstride]
4375 vmovd xmm2, [p_src + 2 * i_srcstride]
4377 vmovd xmm3, [p_src + i_srcstride3]
4379 lea p_src, [p_src + 4 * i_srcstride]
4380 vmovd xmm4, [p_src]
4382 vmovd xmm5, [p_src + i_srcstride]
4403 vmovd xmm1, [p_src + 2 * i_srcstride]
4405 vmovd xmm0, [p_src + i_srcstride3]
4406 lea p_src, [p_src + 4 * i_srcstride]
4407 vpunpcklwd xmm0, xmm0, [p_src]
4411 vpbroadcastq xmm6, [p_src + 2 * i_srcstride - 6]
4416 pop p_src
4420 vmovdqa ymm0, [p_src]
4421 vmovdqa ymm1, [p_src + i_srcstride]
4422 vmovdqa ymm2, [p_src + 2 * i_srcstride]
4423 vmovdqa ymm3, [p_src + i_srcstride3]
4424 lea p_src, [p_src + 4 * i_srcstride]
4425 vmovdqa ymm4, [p_src]
4427 vmovdqa ymm5, [p_src + i_srcstride]
4429 vmovdqa ymm6, [p_src + 2 * i_srcstride]
4431 vmovdqa ymm7, [p_src + i_srcstride3]
4432 lea p_src, [p_src + 4 * i_srcstride]
4439 vmovdqa ymm0, [p_src]
4446 vmovdqa ymm1, [p_src + i_srcstride]
4448 vmovdqa ymm2, [p_src + 2 * i_srcstride]
4450 vmovdqa ymm3, [p_src + i_srcstride3]
4451 lea p_src, [p_src + 4 * i_srcstride]
4458 vmovdqa ymm4, [p_src]
4468 vmovdqa ymm5, [p_src + i_srcstride]
4482 %undef p_src