/third_party/openh264/codec/encoder/core/arm/ |
D | pixel_neon.S | 61 vsubl.u8 q13, d4, d6 64 vadd.s16 q2, q12, q13 65 vsub.s16 q3, q12, q13 76 vadd.s16 q13, q8, q10 86 vtrn.16 q13, q15 91 vadd.s16 q9, q13, q15 92 vabd.s16 q11, q13, q15 103 vadd.s16 q13, q1, q3 107 vabs.s16 q13, q13 113 vtrn.32 q13, q15 [all …]
|
/third_party/ffmpeg/libavcodec/arm/ |
D | rv34dsp_neon.S | 28 vshll.s16 q13, d29, #4 36 vaddw.s16 q13, q13, d29 @ z3 = block[i+4*1]*17 39 vadd.s32 q13, q13, q9 @ z3 = 17*block[i+4*1] + 7*block[i+4*3] 41 vadd.s32 q1, q10, q13 @ z0 + z3 43 vsub.s32 q8, q10, q13 @ z0 - z3 54 vmul.s32 q13, q11, d0[0] 64 vadd.s32 q2, q13, q12 @ z1 + z2 66 vsub.s32 q3, q13, q12 @ z1 - z2 106 vshl.s32 q13, q15, #1 110 vadd.s32 q13, q13, q15 [all …]
|
D | vp6dsp_neon.S | 25 vmov.i16 q13, #1 38 vsub.i16 q8, q3, q13 @ t-1 45 vsub.i16 q12, q12, q13 @ V-t-1 49 vadd.i16 q13, q3, q3 @ 2*t 51 vsub.i16 q13, q13, q1 @ 2*t - V 53 vadd.i16 q13, q13, q2 @ += s 55 veor q13, q13, q2 @ ^= s 57 vbif q0, q13, q12
|
D | h264idct_neon.S | 202 vtrn.16 q12, q13 205 vtrn.32 q13, q15 221 vsub.i16 q0, q13, q11 224 vadd.i16 q3, q13, q11 227 vadd.i16 qa, qa, q13 231 vshr.s16 q13, q13, #1 235 vadd.i16 qa, qa, q13 239 vshr.s16 q13, qa, #2 243 vadd.i16 q1, q1, q13 254 vsub.i16 q13, q12, q1 [all …]
|
D | hevcdsp_idct_neon.S | 73 vmvn.s16 q13, #0xFC00 @ vmov.s16 #0x3FF 74 clip10 q0, q1, q12, q13 107 vmvn.s16 q13, #0xFC00 @ vmov.s16 #0x3FF 114 clip10 q0, q1, q12, q13 133 vmovl.u8 q13, d23 137 vqadd.s16 q3, q13 151 vmvn.s16 q13, #0xFC00 @ vmov.s16 #0x3FF 163 clip10 q0, q1, q12, q13 164 clip10 q2, q3, q12, q13 177 vld1.8 {q12, q13}, [r0, :128] [all …]
|
D | hevcdsp_qpel_neon.S | 86 vmull.s16 q13, d8, d16 // 17 * e0 94 vadd.s32 q9, q13 // 58 * d0 - 10 * c0 + 17 * e0 96 vsubl.s16 q13, d12, d0 // g0 - a0 100 vsub.s32 q13, q15 // g0 - a0 - 5 * f0 102 vadd.s32 q9, q13 // 58 * d0 - 10 * c0 + 17 * e0 + 4 * b0 + g0 - a0 - 5 * f0 123 vaddl.s16 q13, d0, d14 // a0 + h0 127 vadd.s32 q11, q13 // 11 * (c0 + f0) + a0 + h0 146 vmull.s16 q13, d6, d16 // 17 * e0 154 vadd.s32 q9, q13 // 58 * d0 - 10 * c0 + 17 * e0 156 vsubl.s16 q13, d2, d14 // g0 - a0 [all …]
|
D | fft_neon.S | 79 vrev64.32 q13, q13 86 vext.32 q13, q12, q12, #1 108 vext.32 q13, q9, q9, #1 128 vld1.32 {d24-d27}, [r0,:128]! @ q12{r8,i8,r9,i9} q13{r10,i10,r11,i11} 136 vext.32 q13, q13, q13, #1 141 vswp d25, d26 @ q12{r8,i8,i10,r11} q13{r9,i9,i11,r10} 144 vadd.f32 q0, q12, q13 @ {t1,t2,t5,t6} 147 vsub.f32 q13, q12, q13 @ {t3,t4,t7,t8} 152 vswp d1, d26 @ q0{t1,t2,t3,t4} q13{t6,t5,t7,t8} 154 vadd.f32 q12, q0, q13 @ {r8,i8,r9,i9} [all …]
|
D | vp3dsp_neon.S | 172 vadd.s16 q4, q4, q13 // ip[5] * C5 188 vadd.s16 q2, q2, q13 // ip[5] * C3 190 vsub.s16 q13, q2, q1 // D = ip[5] * C3 - ip[3] * C5 193 vsub.s16 q9, q15, q13 // (B - D) 194 vadd.s16 q13, q15, q13 // Dd = B + D 238 vadd.s16 q11, q12, q13 // [3] = Ed + Dd 239 vsub.s16 q12, q12, q13 // [4] = Ed - Dd 243 vadd.s16 q13, q3, q14 // [5] = Fd + Bdd 249 vtrn.16 q12, q13 254 vtrn.32 q13, q15 [all …]
|
D | simple_idct_neon.S | 56 vsub.i32 q13, q15, q8 107 vsub.i32 q13, q13, q7 117 vadd.i32 q13, q13, q8 124 vadd.i32 q7, q13, q5 132 vsub.i32 q13, q13, q5 137 vshrn.i32 d5, q13, #ROW_SHIFT 175 vsub.i32 q13, q13, q7 202 vadd.i32 q13, q13, q8 217 vaddhn.i32 d4, q13, q5 221 vsubhn.i32 d7, q13, q5
|
D | lossless_audiodsp_neon.S | 40 vmul.s16 q13, q13, q14 44 vadd.s16 q13, q11, q13 49 vst1.16 {q13}, [r12,:128]!
|
D | aacpsdsp_neon.S | 190 vld1.32 {q13}, [r2,:128]! 195 vmla.f32 q14, q8, q13 197 vmla.f32 q15, q9, q13 200 vld1.32 {q13}, [r2,:128]! 202 vmla.f32 q14, q10, q13 204 vmla.f32 q15, q11, q13 205 vld1.32 {q13}, [r2,:128]! 210 vmla.f32 q14, q8, q13 212 vmla.f32 q15, q9, q13 219 vld1.32 {q13}, [r2,:128]! [all …]
|
D | vc1dsp_neon.S | 85 @ Trashes: r12 q8 q9 q10 q11 q12 q13 90 vsub.i16 q13, q0, q2 @ temp2 = src[0] - src[2] 103 vmla.i16 q9, q13, d0[0] @ t2 = 17 * (temp2) + 4 165 vshl.i16 q13, q1, #2 @ temp3b|temp4b = 4 * (src[40]|src[8]) 168 vsub.i16 q9, q13, q12 @ t3|t4 = - (temp3a|temp4a) + (temp3b|temp4b) 235 @ Input columns: q8, q9, q10, q11, q12, q13, q14, q15 236 @ Output columns: q8, q9, q10, q11, q12, q13, q14, q15 272 @ q13 src[40] 290 vmla.i16 q3, q13, d0[1] @ t1 += 9 * src[40] 291 vmla.i16 q10, q13, d0[0] @ t4 += 15 * src[40] [all …]
|
D | vp9mc_neon.S | 308 vmovl.u8 q13, d26 322 extmla q1, q2, q3, q4, d2, d6, q8, q9, q10, q11, q12, q13, 1, \size 323 extmla q1, q2, q3, q4, d2, d6, q8, q9, q10, q11, q12, q13, 2, \size 324 extmla q1, q2, q3, q4, d2, d6, q8, q9, q10, q11, q12, q13, \idx1, \size 325 extmla q1, q2, q3, q4, d2, d6, q8, q9, q10, q11, q12, q13, 5, \size 326 extmla q1, q2, q3, q4, d2, d6, q8, q9, q10, q11, q12, q13, 6, \size 327 extmla q1, q2, q3, q4, d2, d6, q8, q9, q10, q11, q12, q13, 7, \size 328 extmulqadd q1, q2, q3, q4, d2, d6, q8, q9, q10, q11, q12, q13, \idx2, \size 364 vmov q11, q13 366 vld1.8 {q13}, [r7]! [all …]
|
D | hevcdsp_deblock_neon.S | 69 vmovl.u8 q13, d26 76 vsub.i16 q6, q13 78 vabd.s16 q6, q6, q13 166 vadd.i16 q1, q13 184 vadd.i16 q4, q2, q13 198 vsub.i16 q3, q13 207 vadd.i16 q3, q13 210 vbit q13, q3, q5 231 vsub.i16 q0, q13, q10 264 vsub.s16 q3, q13 [all …]
|
D | vp8dsp_neon.S | 87 vmull.s16 q13, d3, d4[0] 91 vshrn.s32 d22, q13, #16 110 vmull.s16 q13, d2, d4[0] 115 vshrn.s32 d22, q13, #16 203 vaddw.u8 q13, q9, d6 215 vqmovun.s16 d26, q13 248 vaddw.u8 q13, q8, d6 259 vqmovun.s16 d26, q13 262 vst1.8 {q13}, [r0,:128], r2 280 vmov.i8 q13, #0x80 [all …]
|
D | h264dsp_neon.S | 156 transpose_8x8 q3, q10, q9, q8, q0, q1, q2, q13 311 vmov q13, q8 314 \macd q13, d0, d29 318 \macs q13, d1, d31 324 vshl.s16 q13, q13, q9 326 vqmovun.s16 d25, q13 455 vmull.u8 q13, d0, d29 464 \add q13, q8, q13 465 vrshl.s16 q13, q13, q9 467 vqmovun.s16 d25, q13
|
D | hpeldsp_neon.S | 120 NRND vmov.i16 q13, #1 133 NRND vadd.u16 q12, q12, q13 137 NRND vadd.u16 q1, q1, q13 149 NRND vadd.u16 q12, q12, q13 153 NRND vadd.u16 q0, q0, q13 166 NRND vadd.u16 q12, q12, q13 170 NRND vadd.u16 q1, q1, q13 180 NRND vadd.u16 q12, q12, q13 183 NRND vadd.u16 q0, q0, q13
|
/third_party/openh264/codec/common/arm/ |
D | mc_neon.S | 38 vaddl.u8 q13, \arg2, \arg1 39 vrshrn.u16 \arg0, q13, #1 46 vaddl.u8 q13, \arg2, \arg3 //src[0]+src[1] 47 vmla.u16 q12, q13, \arg7 //q12 += 20*(src[0]+src[1]), 2 cycles 48 vaddl.u8 q13, \arg1, \arg4 //src[-1]+src[2] 49 vmls.s16 q12, q13, \arg8 //q12 -= 5*(src[-1]+src[2]), 2 cycles 68 vaddl.u8 q13, \arg2, \arg3 //src[0]+src[1] 69 vmla.u16 q12, q13, \arg7 //q12 += 20*(src[0]+src[1]), 2 cycles 70 vaddl.u8 q13, \arg1, \arg4 //src[-1]+src[2] 71 vmls.s16 q12, q13, \arg8 //q12 -= 5*(src[-1]+src[2]), 2 cycles [all …]
|
D | deblocking_neon.S | 188 DIFF_LUMA_LT4_P1_Q1 q5, q4, q3, q2, q9, q15, q14, q10, q7, q13 191 vabs.s8 q13, q13 193 vadd.u8 q14,q14,q13 197 DIFF_LUMA_LT4_P0_Q0 d2, d4, d6, d8, d16, q12, q13 198 DIFF_LUMA_LT4_P0_Q0 d3, d5, d7, d9, d17, q12, q13 225 vld1.u8 {q13}, [r0], r1 232 MASK_MATRIX q10, q11, q12, q13, q5, q4, q6 269 DIFF_LUMA_EQ4_MASK q15, q13, q0, q4 329 DIFF_LUMA_LT4_P1_Q1 q5, q4, q3, q2, q9, q15, q14, q10, q7, q13 332 vabs.s8 q13, q13 [all …]
|
/third_party/flutter/skia/third_party/externals/libjpeg-turbo/simd/arm/ |
D | jsimd_neon.S | 260 vmul.s16 q13, q13, q1 514 vqrshrn.s16 d21, q13, #2 749 vmul.s16 q13, q13, q1 756 vsub.s16 q1, q11, q13 757 vadd.s16 q13, q11, q13 766 vsub.s16 q2, q15, q13 778 vadd.s16 q6, q15, q13 790 vsub.s16 q13, q10, q2 798 vtrn.16 q12, q13 802 vtrn.32 q13, q15 [all …]
|
/third_party/libjpeg-turbo/simd/arm/aarch32/ |
D | jsimd_neon.S | 249 vmul.s16 q13, q13, q1 503 vqrshrn.s16 d21, q13, #2 738 vmul.s16 q13, q13, q1 745 vsub.s16 q1, q11, q13 746 vadd.s16 q13, q11, q13 755 vsub.s16 q2, q15, q13 767 vadd.s16 q6, q15, q13 779 vsub.s16 q13, q10, q2 787 vtrn.16 q12, q13 791 vtrn.32 q13, q15 [all …]
|
/third_party/ffmpeg/libswscale/arm/ |
D | rgb2yuv_neon_32.S | 35 alias y32x16_eh, q13 42 alias y16x16_o, q13 55 vmovn.i32 CO_R, q13 96 alias_qw c16x8, q13
|
/third_party/ffmpeg/libavresample/arm/ |
D | audio_convert_neon.S | 90 vld1.32 {q13}, [r3,:128]! 93 vcvt.s32.f32 q13, q13, #31 97 vsri.32 q13, q1, #16 106 vst1.16 {q13}, [r0,:128]! 118 vld1.32 {q13}, [r3,:128]! 119 vcvt.s32.f32 q13, q13, #31 123 vsri.32 q13, q1, #16 124 vst1.16 {q12-q13},[r0,:128]!
|
/third_party/ffmpeg/libswresample/arm/ |
D | audio_convert_neon.S | 92 vld1.32 {q13}, [r3,:128]! 95 vcvt.s32.f32 q13, q13, #31 99 vsri.32 q13, q1, #16 108 vst1.16 {q13}, [r0,:128]! 120 vld1.32 {q13}, [r3,:128]! 121 vcvt.s32.f32 q13, q13, #31 125 vsri.32 q13, q1, #16 126 vst1.16 {q12-q13},[r0,:128]!
|
/third_party/openh264/codec/processing/src/arm/ |
D | adaptive_quantization.S | 51 vabd.u8 q13, q14, q15 57 vaddl.u8 q13, d26, d27 //sum 81 vpadal.u8 q13, q2
|