/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/arm/neon/ |
D | idct_dequant_full_2x_neon.asm | 28 vld1.16 {q4, q5}, [r0] ; r q 47 vmul.i16 q5, q5, q1 52 ; q4: l4r4 q5: l12r12 62 vqdmulh.s16 q7, q5, d0[2] 64 vqdmulh.s16 q9, q5, d0[0] 81 ; q5: 12 + 12 * cospi : c1/temp2 83 vqadd.s16 q5, q5, q9 87 vqsub.s16 q2, q6, q5 95 vqadd.s16 q5, q11, q2 101 vtrn.32 q5, q7 [all …]
|
D | sixtappredict4x4_neon.asm | 64 vld1.u8 {q5}, [r0], r1 89 vmov q6, q5 101 vshr.u64 q5, q6, #32 115 vshr.u64 q5, q6, #24 130 vld1.u8 {q5}, [r0], r1 155 vmov q6, q5 169 vshr.u64 q5, q6, #32 189 vshr.u64 q5, q6, #24 210 vld1.s32 {q5, q6}, [r3] ;load second_pass filter 217 vabs.s32 q7, q5 [all …]
|
D | sixtappredict8x4_neon.asm | 71 vld1.u8 {q5}, [r0], r1 131 vmull.u8 q5, d30, d3 136 vqadd.s16 q9, q5 148 vld1.u8 {q5}, [r0], r1 218 vmull.u8 q5, d29, d3 224 vqadd.s16 q10, q5 239 vld1.s32 {q5, q6}, [r3] ;load second_pass filter 242 vabs.s32 q7, q5 256 vmull.u8 q5, d24, d0 261 vmlsl.u8 q5, d25, d1 [all …]
|
D | mbloopfilter_neon.asm | 39 vld1.u8 {q5}, [r0@128], r1 ; p1 52 vst1.u8 {q5}, [r0@128],r1 ; store op1 158 vtrn.32 q5, q9 161 vtrn.16 q3, q5 167 vtrn.8 q5, q6 180 vtrn.32 q5, q9 183 vtrn.16 q3, q5 189 vtrn.8 q5, q6 253 vtrn.32 q5, q9 256 vtrn.16 q3, q5 [all …]
|
D | sixtappredict8x8_neon.asm | 74 vld1.u8 {q5}, [r0], r1 135 vmull.u8 q5, d30, d3 142 vqadd.s16 q9, q5 155 vld1.u8 {q5}, [r0], r1 165 ;vld1.u8 {q5}, [r0], r1 231 vmull.u8 q5, d29, d3 237 vqadd.s16 q10, q5 250 vld1.s32 {q5, q6}, [r3] ;load second_pass filter 255 vabs.s32 q7, q5 274 vmull.u8 q5, d20, d0 [all …]
|
D | vp8_subpixelvariance16x16s_neon.asm | 57 vext.8 q5, q4, q5, #1 63 vrhadd.u8 q2, q4, q5 67 vsubl.u8 q5, d1, d23 81 vpadal.s16 q8, q5 113 vmull.s32 q5, d0, d0 150 vld1.8 {q5}, [r2], r3 209 vmull.s32 q5, d0, d0 255 vext.8 q5, q4, q5, #1 260 vrhadd.u8 q2, q4, q5 264 vld1.8 {q5}, [r2], r3 [all …]
|
D | loopfilter_neon.asm | 38 vld1.u8 {q5}, [r2@128], r1 ; p1 50 vst1.u8 {q5}, [r2@128], r1 ; store op1 151 vtrn.32 q5, q9 156 vtrn.16 q3, q5 162 vtrn.8 q5, q6 241 vtrn.32 q5, q9 246 vtrn.16 q3, q5 252 vtrn.8 q5, q6 297 ; q5 p1 307 vabd.u8 q12, q4, q5 ; abs(p2 - p1) [all …]
|
D | sixtappredict16x16_neon.asm | 169 vmull.u8 q5, d29, d3 173 vqadd.s16 q10, q5 203 vld1.s32 {q5, q6}, [r3] ;load second_pass filter 206 vabs.s32 q7, q5 234 vmull.u8 q5, d20, d0 239 vmlsl.u8 q5, d21, d1 244 vmlsl.u8 q5, d24, d4 249 vmlal.u8 q5, d22, d2 254 vmlal.u8 q5, d25, d5 266 vqadd.s16 q9, q5 [all …]
|
D | sad16_neon.asm | 31 vld1.8 {q5}, [r2], r3 56 vld1.8 {q5}, [r2], r3 81 vld1.8 {q5}, [r2], r3 106 vld1.8 {q5}, [r2], r3 150 vld1.8 {q5}, [r2], r3 174 vld1.8 {q5}, [r2], r3
|
D | loopfiltersimplehorizontaledge_neon.asm | 29 vld1.u8 {q5}, [r3@128], r1 ; p0 34 vabd.u8 q14, q5, q8 ; abs(p1 - q1) 44 veor q5, q5, q0 ; ps1: p1 offset to convert to a signed value 52 vqsub.s8 q4, q5, q8 ; q4: vp8_filter = vp8_signed_char_clamp(ps1-qs1)
|
D | buildintrapredictorsmby_neon.asm | 245 vmull.u8 q5, d17, d0 248 vsub.s16 q5, q5, q7 265 vqadd.s16 q9, q0, q5 268 vqadd.s16 q11, q1, q5 271 vqadd.s16 q13, q2, q5 274 vqadd.s16 q15, q3, q5 528 vmull.u8 q5, d17, d0 531 vsub.s16 q5, q5, q7 548 vqadd.s16 q9, q0, q5 551 vqadd.s16 q11, q1, q5 [all …]
|
D | vp8_subpixelvariance8x8_neon.asm | 74 vld1.u8 {q5}, [r0], r1 117 vmull.u8 q5, d26, d0 126 vmlal.u8 q5, d27, d1 135 vqrshrn.u16 d26, q5, #7 173 vsubl.u8 q5, d23, d1 182 vpadal.s16 q8, q5 207 vmull.s32 q5, d0, d0
|
D | dequant_idct_neon.c | 24 int16x8_t q1, q2, q3, q4, q5, q6; in vp8_dequant_idct_add_neon() local 39 q5 = vld1q_s16(dq); in vp8_dequant_idct_add_neon() 54 vreinterpretq_u16_s16(q5))); in vp8_dequant_idct_add_neon()
|
D | loopfiltersimpleverticaledge_neon.asm | 53 vabd.u8 q15, q5, q4 ; abs(p0 - q0) 63 veor q5, q5, q0 ; ps0: p0 offset to convert to a signed value 97 vqadd.s8 q11, q5, q2 ; u = vp8_signed_char_clamp(ps0 + Filter2)
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/arm/neon/ |
D | vp9_idct32x32_add_neon.asm | 180 vrshr.s16 q5, q5, #6 185 vaddw.u8 q5, q5, d5 190 vqmovun.s16 d5, q5 214 vrshr.s16 q5, q5, #6 219 vaddw.u8 q5, q5, d5 224 vqmovun.s16 d5, q5 376 vld1.s16 {q5}, [r3]! 400 vtrn.32 q5, q7 407 vtrn.16 q4, q5 425 vst1.16 {q5}, [r0]! [all …]
|
D | vp9_loopfilter_16_neon.asm | 59 vld1.u8 {q5}, [r2@64], r1 ; p1 71 vst1.u8 {q5}, [r2@64], r1 ; store op1 92 ; q5 p1 100 ; q5 op1 108 vabd.u8 q12, q4, q5 ; m2 = abs(p2 - p1) 109 vabd.u8 q13, q5, q6 ; m3 = abs(p1 - p0) 130 vabd.u8 q2, q5, q8 ; a = abs(p1 - q1) 140 veor q5, q5, q10 ; ps1 152 vqsub.s8 q1, q5, q8 ; filter = clamp(ps1-qs1) 189 vqadd.s8 q13, q5, q1 ; u = clamp(ps1 + filter) [all …]
|
D | vp9_iht8x8_add_neon.asm | 135 vmull.s16 q5, d26, d2 143 vmlsl.s16 q5, d22, d3 151 vqrshrn.s32 d10, q5, #14 ; >> 14 241 vsub.s16 q13, q4, q5 ; step2[5] = step1[4] - step1[5] 242 vadd.s16 q4, q4, q5 ; step2[4] = step1[4] + step1[5] 273 vadd.s16 q10, q2, q5 ; output[2] = step1[2] + step1[5]; 276 vsub.s16 q13, q2, q5 ; output[5] = step1[2] - step1[5]; 310 vmull.s16 q5, d22, d30 318 vmlal.s16 q5, d24, d31 326 vadd.s32 q11, q1, q5 [all …]
|
D | vp9_idct16x16_add_neon.asm | 92 vmull.s16 q5, d18, d1 100 vmlal.s16 q5, d30, d0 111 vqrshrn.s32 d14, q5, #14 ; >> 14 206 vsub.s16 q13, q4, q5 ; step2[5] = step1[4] - step1[5]; 207 vadd.s16 q4, q4, q5 ; step2[4] = step1[4] + step1[5]; 250 vadd.s16 q10, q2, q5 ; step2[2] = step1[2] + step1[5]; 253 vsub.s16 q13, q2, q5 ; step2[5] = step1[2] - step1[5]; 376 vmull.s16 q5, d25, d31 384 vmlal.s16 q5, d23, d30 395 vqrshrn.s32 d13, q5, #14 ; >> 14 [all …]
|
D | vp9_idct8x8_add_neon.asm | 36 vmull.s16 q5, d26, d2 44 vmlsl.s16 q5, d22, d3 52 vqrshrn.s32 d10, q5, #14 ; >> 14 143 vsub.s16 q13, q4, q5 ; step2[5] = step1[4] - step1[5] 144 vadd.s16 q4, q4, q5 ; step2[4] = step1[4] + step1[5] 175 vadd.s16 q10, q2, q5 ; output[2] = step1[2] + step1[5]; 178 vsub.s16 q13, q2, q5 ; output[5] = step1[2] - step1[5]; 383 vqrdmulh.s16 q5, q11, q0 416 vsub.s16 q13, q4, q5 ; step2[5] = step1[4] - step1[5] 417 vadd.s16 q4, q4, q5 ; step2[4] = step1[4] + step1[5] [all …]
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/mips/dspr2/ |
D | vp9_loopfilter_macros_dspr2.h | 383 [q4] "r" (q4), [q5] "r" (q5), [q6] "r" (q6), [q7] "r" (q7) \ 423 [q4] "r" (q4), [q5] "r" (q5), [q6] "r" (q6), [q7] "r" (q7) \ 461 [q5] "=&r" (q5),[q6] "=&r" (q6) \
|
D | vp9_loopfilter_filters_dspr2.h | 537 const uint32_t q4 = *oq4, q5 = *oq5, q6 = *oq6, q7 = *oq7; in vp9_wide_mbfilter_dspr2() local 566 [q4] "r" (q4), [q5] "r" (q5), [q6] "r" (q6), in vp9_wide_mbfilter_dspr2() 652 [q3] "r" (q3), [q4] "r" (q4), [q5] "r" (q5), [q6] "r" (q6), in vp9_wide_mbfilter_dspr2() 743 : [q7] "r" (q7), [q6] "r" (q6), [q5] "r" (q5), [q4] "r" (q4), in vp9_wide_mbfilter_dspr2()
|
D | vp9_mblpf_vert_loopfilter_dspr2.c | 34 uint32_t p7, p6, p5, p4, p3, p2, p1, p0, q0, q1, q2, q3, q4, q5, q6, q7; in vp9_lpf_vertical_16_dspr2() local 95 [q5] "=&r" (q5), [q4] "=&r" (q4) in vp9_lpf_vertical_16_dspr2() 246 [q7] "+r" (q7), [q6] "+r" (q6), [q5] "+r" (q5), [q4] "+r" (q4), in vp9_lpf_vertical_16_dspr2() 255 vp9_flatmask5(p7, p6, p5, p4, p0, q0, q4, q5, q6, q7, &flat2); in vp9_lpf_vertical_16_dspr2()
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/neon/ |
D | fastquantizeb_neon.asm | 38 vabs.s16 q5, q1 50 vadd.s16 q5, q7 55 vqdmulh.s16 q5, q9 64 veor.s16 q5, q3 75 vshr.s16 q5, #1 99 vmul.s16 q3, q7, q5 113 vtst.16 q15, q5, q8 ; non-zero element is set to all 1
|
D | vp8_memcpy_neon.asm | 36 vld1.8 {q4, q5}, [r1]! 39 vst1.8 {q4, q5}, [r0]!
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/ |
D | vp9_loopfilter_filters.c | 246 q4 = *oq4, q5 = *oq5, q6 = *oq6, q7 = *oq7; in filter16() local 260 q0 + q1 + q2 + q3 + q4 + q5, 4); in filter16() 262 q0 + q1 + q2 + q3 + q4 + q5 + q6, 4); in filter16() 264 q0 * 2 + q1 + q2 + q3 + q4 + q5 + q6 + q7, 4); in filter16() 266 q0 + q1 * 2 + q2 + q3 + q4 + q5 + q6 + q7 * 2, 4); in filter16() 268 q0 + q1 + q2 * 2 + q3 + q4 + q5 + q6 + q7 * 3, 4); in filter16() 270 q0 + q1 + q2 + q3 * 2 + q4 + q5 + q6 + q7 * 4, 4); in filter16() 272 q0 + q1 + q2 + q3 + q4 * 2 + q5 + q6 + q7 * 5, 4); in filter16() 274 q0 + q1 + q2 + q3 + q4 + q5 * 2 + q6 + q7 * 6, 4); in filter16() 276 q0 + q1 + q2 + q3 + q4 + q5 + q6 * 2 + q7 * 7, 4); in filter16()
|