/external/libvpx/libvpx/vp8/encoder/arm/neon/ |
D | shortfdct_neon.c | 18 int32x4_t q9s32, q10s32, q11s32, q12s32; in vp8_short_fdct4x4_neon() local 25 q10s32 = vdupq_n_s32(7500); in vp8_short_fdct4x4_neon() 60 q10s32 = vmlal_s16(q10s32, d7s16, d17s16); in vp8_short_fdct4x4_neon() 62 q10s32 = vmlsl_s16(q10s32, d6s16, d16s16); in vp8_short_fdct4x4_neon() 65 d3s16 = vshrn_n_s32(q10s32, 12); in vp8_short_fdct4x4_neon() 118 int32x4_t q9s32, q10s32, q11s32, q12s32; in vp8_short_fdct8x4_neon() local 125 q10s32 = vdupq_n_s32(7500); in vp8_short_fdct8x4_neon() 160 q12s32 = q10s32; in vp8_short_fdct8x4_neon() 168 q10s32 = vmlal_s16(q10s32, d28s16, d17s16); in vp8_short_fdct8x4_neon() 173 q10s32 = vmlsl_s16(q10s32, d26s16, d16s16); in vp8_short_fdct8x4_neon() [all …]
|
D | vp8_shortwalsh4x4_neon.c | 25 int32x4_t q9s32, q10s32, q11s32, q15s32; in vp8_short_walsh4x4_neon() local 79 q10s32 = vsubl_s16(v2tmp1.val[1], v2tmp0.val[1]); in vp8_short_walsh4x4_neon() 83 q1s32 = vaddq_s32(q11s32, q10s32); in vp8_short_walsh4x4_neon() 84 q2s32 = vsubq_s32(q11s32, q10s32); in vp8_short_walsh4x4_neon() 94 q10s32 = vreinterpretq_s32_u32(q10u32); in vp8_short_walsh4x4_neon() 99 q2s32 = vsubq_s32(q2s32, q10s32); in vp8_short_walsh4x4_neon() 104 q10s32 = vaddq_s32(q2s32, q15s32); in vp8_short_walsh4x4_neon() 109 d2s16 = vshrn_n_s32(q10s32, 3); in vp8_short_walsh4x4_neon()
|
/external/libvpx/libvpx/vp9/common/arm/neon/ |
D | vp9_iht4x4_add_neon.c | 62 int32x4_t q10s32, q13s32, q14s32, q15s32; in IDCT4x4_1D() local 74 q10s32 = vmull_s16(d17s16, *d0s16); in IDCT4x4_1D() 78 q10s32 = vmlal_s16(q10s32, d19s16, *d2s16); in IDCT4x4_1D() 83 d28s16 = vrshrn_n_s32(q10s32, 14); in IDCT4x4_1D() 96 int32x4_t q8s32, q9s32, q10s32, q11s32, q12s32, q13s32, q14s32, q15s32; in IADST4x4_1D() local 105 q10s32 = vmull_s16(*d3s16, d16s16); in IADST4x4_1D() 116 q10s32 = vaddq_s32(q10s32, q13s32); in IADST4x4_1D() 117 q10s32 = vaddq_s32(q10s32, q8s32); in IADST4x4_1D() 123 q13s32 = vaddq_s32(q10s32, q12s32); in IADST4x4_1D() 124 q10s32 = vaddq_s32(q10s32, q11s32); in IADST4x4_1D() [all …]
|
D | vp9_iht8x8_add_neon.c | 45 int32x4_t q10s32, q11s32, q12s32, q13s32, q15s32; in IDCT8x8_1D() local 159 q10s32 = vmull_s16(d29s16, d16s16); in IDCT8x8_1D() 164 q10s32 = vmlsl_s16(q10s32, d27s16, d16s16); in IDCT8x8_1D() 169 d11s16 = vrshrn_n_s32(q10s32, 14); in IDCT8x8_1D() 195 int32x4_t q9s32, q10s32, q11s32, q12s32, q13s32, q14s32, q15s32; in IADST8X8_1D() local 283 q10s32 = vmull_s16(d18s16, d31s16); in IADST8X8_1D() 286 q10s32 = vmlsl_s16(q10s32, d28s16, d30s16); in IADST8X8_1D() 289 q14s32 = vaddq_s32(q2s32, q10s32); in IADST8X8_1D() 291 q2s32 = vsubq_s32(q2s32, q10s32); in IADST8X8_1D() 301 q10s32 = vaddq_s32(q5s32, q13s32); in IADST8X8_1D() [all …]
|
/external/libvpx/libvpx/vpx_dsp/arm/ |
D | variance_neon.c | 267 int32x4_t q7s32, q8s32, q9s32, q10s32; in vpx_mse16x16_neon() local 274 q10s32 = vdupq_n_s32(0); in vpx_mse16x16_neon() 299 q10s32 = vmlal_s16(q10s32, d25s16, d25s16); in vpx_mse16x16_neon() 309 q10s32 = vmlal_s16(q10s32, d29s16, d29s16); in vpx_mse16x16_neon() 313 q9s32 = vaddq_s32(q9s32, q10s32); in vpx_mse16x16_neon() 314 q10s32 = vaddq_s32(q7s32, q9s32); in vpx_mse16x16_neon() 316 q1s64 = vpaddlq_s32(q10s32); in vpx_mse16x16_neon() 330 int32x4_t q7s32, q8s32, q9s32, q10s32; in vpx_get4x4sse_cs_neon() local 364 q10s32 = vmull_s16(d28s16, d28s16); in vpx_get4x4sse_cs_neon() 367 q9s32 = vaddq_s32(q9s32, q10s32); in vpx_get4x4sse_cs_neon()
|