/third_party/ffmpeg/libavcodec/arm/ |
D | vp9lpf_neon.S | 97 vsubl.u8 q6, d24, d22 @ q0 - p0 123 vmovl.u8 q6, d24 @ q0 152 @ p7 = d16 .. p3 = d20, p0 = d23, q0 = d24, q3 = d27, q7 = d31 164 vabd.u8 d7, d24, d25 @ abs(q0 - q1) 170 vabd.u8 d6, d23, d24 @ abs(p0 - q0) 193 vabd.u8 \tmp1, d25, d24 @ abs(q1 - q0) 194 vabd.u8 \tmp2, d26, d24 @ abs(q2 - q0) 195 vabd.u8 \tmp3, d27, d24 @ abs(q3 - q0) 208 vabd.u8 d9, d28, d24 @ abs(q4 - q0) 210 vabd.u8 d10, d29, d24 @ abs(q5 - q0) [all …]
|
D | vp9itxfm_16bpp_neon.S | 840 butterfly d20, d28, d16, d24 @ d20 = t8a, d28 = t11a 841 butterfly d24, d21, d23, d21 @ d24 = t9, d21 = t10 852 butterfly_r d25, d22, d22, d24 @ d25 = out[9], d22 = out[6] 853 butterfly d23, d24, d11, d20 @ d23 = out[7], d24 = out[8] 863 mbutterfly0 d16, d24, d16, d24, d8, d10, q4, q5 @ d16 = t0a, d24 = t1a 873 butterfly d9, d20, d24, d20 @ d9 = t1, d20 = t2 877 butterfly d24, d21, d29, d21 @ d24 = t11, d21 = t10 888 mbutterfly0_h d16, d24, d16, d24, d8, d10, q4, q5 @ d16 = t0a, d24 = t1a 898 butterfly d9, d20, d24, d20 @ d9 = t1, d20 = t2 902 butterfly d24, d21, d29, d21 @ d24 = t11, d21 = t10 [all …]
|
D | mdct_neon.S | 101 vmul.f32 d24, d0, d16 105 vsub.f32 d4, d4, d24 197 vmul.f32 d24, d16, d30 @ R*c 204 vsub.f32 d24, d25, d24 @ I*s-R*c 231 vst2.32 {d24[0],d25[0]},[r10,:64] 232 vst2.32 {d24[1],d25[1]},[r6,:64] 246 vst2.32 {d24[0],d25[0]},[r10,:64] 247 vst2.32 {d24[1],d25[1]},[r6,:64] 278 vmul.f32 d24, d0, d16 @ r1*c1,r0*c0 282 vadd.f32 d4, d4, d24 @ i1*s1+r1*c1,i0*s0+r0*c0
|
D | rdft_neon.S | 73 vld1.32 {d24}, [r0,:64]! @ d1[0,1] 81 vadd.f32 d0, d24, d7 @ d1[0]+d2[0], d1[1]-d2[1] 95 veor d24, d22, d17 @ ev.re,-ev.im 103 vmla.f32 d24, d2, d4[0] 104 vmla.f32 d24, d23, d5[0] 110 vst1.32 {d24}, [lr,:64], r8
|
D | vorbisdsp_neon.S | 31 vld1.32 {d24-d25},[r1,:128]! 45 vst1.32 {d24-d25},[r3, :128]! 53 vld1.32 {d24-d25},[r1,:128]!
|
D | h264dsp_neon.S | 32 vmov.32 d24[0], r12 43 vmovl.u8 q12, d24 45 vmovl.u16 q12, d24 189 vmovl.u8 q12, d24 194 vsli.16 d24, d24, #8 204 vmin.s8 d4, d4, d24 205 vneg.s8 d25, d24 286 vmov.32 d24[0], r12 325 vqmovun.s16 d24, q12 330 vst1.8 {d24-d25},[r6,:128], r2 [all …]
|
D | fft_neon.S | 74 vmul.f32 d24, d17, d31 @ a2r*w,a2i*w 82 vadd.f32 d24, d24, d26 @ a2r+a2i,a2i-a2r t1,t2 89 vadd.f32 d5, d25, d24 117 vsub.f32 d23, d24, d25 119 vadd.f32 d21, d24, d25 120 vmul.f32 d24, d22, d2 128 vld1.32 {d24-d27}, [r0,:128]! @ q12{r8,i8,r9,i9} q13{r10,i10,r11,i11} 167 vadd.f32 d0, d28, d24 170 vsub.f32 d3, d28, d24 186 vst2.32 {d24-d25},[r0,:128], r1
|
D | hevcdsp_deblock_neon.S | 68 vmovl.u8 q12, d24 283 vqmovun.s16 d24, q12 298 vld1.8 {d24}, [r0], r1 303 transpose_8x8 d16, d18, d20, d22, d24, d26, d28, d30 305 transpose_8x8 d16, d18, d20, d22, d24, d26, d28, d30 310 vst1.8 {d24}, [r0], r1 328 vld1.8 {d24}, [r0], r1 338 vst1.8 {d24}, [r0], r1
|
D | vp9itxfm_neon.S | 824 vst1.16 {d24}, [r0,:64]! 989 @ 16 rows. Afterwards, d16-d19, d20-d23, d24-d27, d28-d31 991 …q9, q10, q11, q12, q13, q14, q15, d16, d17, d18, d19, d20, d21, d22, d23, d24, d25, d26, d27, d28… 998 vst1.16 {d24}, [r0,:64]! 1049 @ 16 rows. Afterwards, d16-d19, d20-d23, d24-d27, d28-d31 1051 …q9, q10, q11, q12, q13, q14, q15, d16, d17, d18, d19, d20, d21, d22, d23, d24, d25, d26, d27, d28…
|
D | hevcdsp_sao_neon.S | 48 vtbx.8 d24, {q0-q1}, d20 52 vtbx.8 d24, {q2-q3}, d20 74 vtbx.8 d24, {q0-q1}, d20 78 vtbx.8 d24, {q2-q3}, d20
|
D | lossless_audiodsp_neon.S | 37 vld1.16 {d24-d25}, [r1]! 45 vmlal.s16 q2, d22, d24
|
/third_party/mindspore/mindspore/ccsrc/backend/kernel_compiler/cpu/nnacl/assembly/arm32/ |
D | MatVecMulFp32.S | 80 vpadd.f32 d28, d22, d24 149 vpadd.f32 d24, d20, d22 151 vadd.f32 d30, d24, d25 182 veor d24, d24, d24 183 vmax.f32 d30, d30, d24
|
D | MatmulInt8Opt.S | 114 vpadd.i32 d24, d24, d25 120 vpadd.i32 d31, d24, d26 137 vld1.32 {d24, d25}, [r6] 138 vdup.32 d20, d24[0] 139 vdup.32 d21, d24[1] 170 vld1.32 {d24, d25}, [r6] 171 vdup.32 d20, d24[0] 172 vdup.32 d21, d24[1] 176 vmul.s32 d24, d20, d19 180 vsub.s32 d28, d28, d24
|
D | MatmulInt8.S | 109 vpadd.i32 d6, d24, d25 132 vld1.32 {d24, d25}, [r6]! 133 vdup.32 d20, d24[0] 134 vdup.32 d21, d24[1] 172 vld1.32 {d24, d25, d26, d27}, [r6]! 173 vsub.s32 d28, d28, d24
|
D | MatmulFp32.S | 168 vst1.32 d24[0], [r2] 184 vst1.32 d24, [r2] 205 vst1.32 d24, [r2] 224 vst1.32 {d24, d25}, [r2] 245 vst1.32 {d24, d25}, [r2] 269 vst1.32 {d24, d25}, [r2] 298 vst1.32 {d24, d25}, [r2]
|
D | MatmulFp32Opt.S | 184 vst1.32 d24[0], [r2] 203 vst1.32 d24, [r2] 227 vst1.32 d24, [r2] 249 vst1.32 {d24, d25}, [r2] 273 vst1.32 {d24, d25}, [r2] 300 vst1.32 {d24, d25}, [r2] 332 vst1.32 {d24, d25}, [r2]
|
D | DeconvDwInt8Center.S | 52 vld1.16 {d24}, [r2]! 53 vmlal.s16 q0, d2, d24
|
/third_party/mindspore/mindspore/ccsrc/backend/kernel_compiler/cpu/nnacl/assembly/arm82_aarch32_fp16/ |
D | Matmul12x8Fp16.S | 390 STORE_12x1 d24[0] 404 STORE_C1 d24[0], #9 419 STORE_12x2 d24[0] 433 STORE_C2 d24[0], #9 448 STORE_12x3 d24[0], d24[2] 462 STORE_C3 d24[0], d24[2], #9 477 STORE_12x4 d24 491 STORE_C4 d24, #9 506 STORE_12x5 d24, d25[0] 520 STORE_C5 d24, d25[0], #9 [all …]
|
D | MatVecMulFp16.S | 97 vmla.f16 d24, d16, d6 106 vpadd.f16 d4, d24, d25 142 vmin.f16 d30, d30, d24 224 veor d24, d24, d24 225 vmax.f16 d30, d30, d24
|
D | TiledC4MatmulFp16.S | 52 vmla.f16 d24, d8, d4[0] 53 vmla.f16 d24, d9, d4[1] 54 vmla.f16 d24, d10, d4[2] 55 vmla.f16 d24, d11, d4[3]
|
/third_party/openh264/codec/encoder/core/arm/ |
D | intra_pred_sad_3_opt_neon.S | 155 HDM_TRANSFORM_4X4_L0 d6, d10, d24, d20, d27, d15, d16, d17, d14 168 HDM_TRANSFORM_4X4_L0 d6, d10, d24, d21, d27, d15, d16, d17, d14 181 HDM_TRANSFORM_4X4_L0 d6, d10, d24, d18, d27, d15, d16, d17, d14 194 HDM_TRANSFORM_4X4_L0 d6, d10, d24, d19, d27, d15, d16, d17, d14 296 vadd.u16 d24, d25 297 vpaddl.u16 d24, d24 298 vpaddl.u32 d24, d24 299 vmov.u32 r0, d24[0] 372 vdup.8 d24, d1[4] 373 vtrn.32 d25, d24 [all …]
|
/third_party/pixman/pixman/ |
D | pixman-arm-neon-asm.S | 585 vmvn.8 d24, d3 /* get inverted alpha */ 587 vmull.u8 q8, d24, d4 588 vmull.u8 q9, d24, d5 589 vmull.u8 q10, d24, d6 590 vmull.u8 q11, d24, d7 715 vmull.u8 q8, d24, d4 716 vmull.u8 q9, d24, d5 717 vmull.u8 q10, d24, d6 718 vmull.u8 q11, d24, d7 751 vmull.u8 q8, d24, d4 [all …]
|
/third_party/openssl/crypto/poly1305/asm/arm32/ |
D | poly1305-armv4.S | 787 vadd.i32 d24,d24,d14 @ accumulate inp[0:1] 836 vmlal.u32 q7,d24,d0[0] 839 vmlal.u32 q8,d24,d1[0] 847 vmlal.u32 q9,d24,d3[0] 852 vmlal.u32 q5,d24,d6[0] 861 vmlal.u32 q6,d24,d8[0] 864 vld4.32 {d20,d22,d24,d26},[r1] @ inp[0:1] 934 vadd.i32 d25,d24,d14 @ add hash value and move to #hi 944 vadd.i32 d24,d24,d14 @ can be redundant 997 vmlal.u32 q7,d24,d0 [all …]
|
/third_party/openh264/codec/processing/src/arm/ |
D | vaa_calc_neon.S | 206 vst4.32 {d22[0],d23[0],d24[0],d25[0]}, [r5]! 465 vadd.i32 d24, d24, d25 466 vst1.32 {d24[0]}, [r7] 624 vadd.i32 d24, d24, d25 625 vst1.32 {d24[0]}, [r7] 747 vadd.i32 d24, d24, d25 748 vst1.32 {d24[0]}, [r7]
|
D | down_sample_neon.S | 279 vqadd.u64 d24, d24,d25 280 vrshr.u64 d24, #30 282 vst1.8 {d24[0]}, [r0]! 293 vld1.8 {d24[0]}, [r4] 294 vst1.8 {d24[0]}, [r0]
|