/third_party/openh264/codec/common/arm/ |
D | mc_neon.S | 152 vshr.u16 q15, q14, #2 // 5 165 FILTER_6TAG_8BITS d0, d4, d6, d16, d18, d20, d2, q14, q15 167 FILTER_6TAG_8BITS d1, d5, d7, d17, d19, d21, d3, q14, q15 184 vshr.u16 q15, q14, #2 // 5 196 FILTER_6TAG_8BITS d0, d2, d3, d4, d5, d6, d1, q14, q15 213 vshr.u16 q15, q14, #2 // 5 231 FILTER_6TAG_8BITS d0, d4, d6, d7, d2, d5, d1, q14, q15 251 vshr.u16 q15, q14, #2 // 5 264 FILTER_6TAG_8BITS_AVERAGE_WITH_0 d0, d4, d6, d16, d18, d20, d2, q14, q15 266 FILTER_6TAG_8BITS_AVERAGE_WITH_0 d1, d5, d7, d17, d19, d21, d3, q14, q15 [all …]
|
D | deblocking_neon.S | 179 MASK_MATRIX q1, q2, q3, q4, q11, q9, q15 180 vand.u8 q10, q10, q15 182 veor q15, q15 183 vsub.i8 q15,q15,q14 185 DIFF_LUMA_LT4_P1_Q1 q0, q1, q2, q3, q9, q15, q14, q10, q6, q12 188 DIFF_LUMA_LT4_P1_Q1 q5, q4, q3, q2, q9, q15, q14, q10, q7, q13 194 veor q15, q15 195 vsub.i8 q15,q15,q14 199 vmax.s8 q8, q8, q15 229 vld1.u8 {q15}, [r0] [all …]
|
/third_party/mindspore/mindspore/ccsrc/backend/kernel_compiler/cpu/nnacl/assembly/arm32/ |
D | MatmulInt8Opt.S | 74 vmull.s8 q15, d2, d8 76 vmlal.s8 q15, d3, d9 78 vpadal.s16 q8, q15 80 vmull.s8 q15, d2, d10 82 vmlal.s8 q15, d3, d11 86 vpadal.s16 q9, q15 89 vmull.s8 q15, d2, d8 91 vmlal.s8 q15, d3, d9 93 vpadal.s16 q12, q15 95 vmull.s8 q15, d2, d10 [all …]
|
D | PostFuncBiasReluC8.S | 46 veor q15, q15, q15 92 vmax.f32 q0, q0, q15 93 vmax.f32 q1, q1, q15 94 vmax.f32 q2, q2, q15 95 vmax.f32 q3, q3, q15 96 vmax.f32 q8, q8, q15 97 vmax.f32 q9, q9, q15 98 vmax.f32 q10, q10, q15 99 vmax.f32 q11, q11, q15 122 vmax.f32 q0, q0, q15 [all …]
|
D | MatVecMulFp32.S | 57 veor q15, q15, q15 95 vmla.f32 q15, q1, d0[0] 103 vadd.f32 q15, q15, q13 115 vmin.f32 q15, q15, q12 119 vmax.f32 q15, q15, q13 122 vst1.f32 {q15}, [r2]! 135 veor q15, q15, q15
|
D | MatmulInt8.S | 73 vmull.s8 q15, d2, d8 77 vmlal.s8 q15, d3, d9 82 vpadal.s16 q8, q15 88 vmull.s8 q15, d2, d8 92 vmlal.s8 q15, d3, d9 97 vpadal.s16 q12, q15 147 vshl.s32 q15, q15, q9 154 vqrdmulh.s32 q15, q15, q8 164 vand q5, q7, q15 166 vqadd.s32 q15, q15, q5 [all …]
|
D | IndirectGemmInt16to32_8x4.S | 31 veor q15, q15, q15 120 vmlal.s16 q15, d8, d6[0] 122 vmlal.s16 q15, d9, d6[1] 124 vmlal.s16 q15, d10, d6[2] 126 vmlal.s16 q15, d11, d6[3] 140 vmlal.s16 q15, d12, d7[0] 142 vmlal.s16 q15, d13, d7[1] 144 vmlal.s16 q15, d14, d7[2] 146 vmlal.s16 q15, d15, d7[3] 209 vmlal.s16 q15, d8, d6[0] [all …]
|
D | PostFuncBiasReluC4.S | 33 veor q15, q15, q15 74 vmax.f32 q0, q0, q15 75 vmax.f32 q1, q1, q15 76 vmax.f32 q2, q2, q15 77 vmax.f32 q3, q3, q15 98 vmax.f32 q0, q0, q15 107 vmax.f32 q0, q0, q15 152 vmax.f32 q0, q0, q15 161 vmax.f32 q0, q0, q15 186 vmax.f32 q0, q0, q15 [all …]
|
D | TiledC4MatmulFp32.S | 75 vmul.f32 q15, q4, d6[0] 80 vmla.f32 q15, q5, d6[1] 85 vmla.f32 q15, q6, d7[0] 90 vmla.f32 q15, q7, d7[1] 129 vmla.f32 q15, q4, d6[0] 134 vmla.f32 q15, q5, d6[1] 140 vmla.f32 q15, q6, d7[0] 146 vmla.f32 q15, q7, d7[1] 181 vmla.f32 q15, q4, d6[0] 186 vmla.f32 q15, q5, d6[1] [all …]
|
D | ConvDwFp32Center.S | 43 veor q15, q15, q15 99 vmax.f32 q0, q0, q15 100 vmax.f32 q1, q1, q15 101 vmax.f32 q2, q2, q15 102 vmax.f32 q3, q3, q15 151 vmax.f32 q0, q0, q15
|
D | MatmulFp32.S | 73 veor q15, q15, q15 85 vmla.f32 q15, q2, d1[1] 103 vadd.f32 q15, q15, q1 123 vmin.f32 q15, q15, q2 134 vmax.f32 q15, q15, q3 315 vst1.32 {q14, q15}, [r2]! 325 vst1.32 {q14, q15}, [r2] 341 vst1.32 {q14, q15}, [r2]
|
/third_party/ffmpeg/libavcodec/arm/ |
D | h264idct_neon.S | 26 vmov.i16 q15, #0 29 vst1.16 {q15}, [r1,:128]! 31 vst1.16 {q15}, [r1,:128]! 191 vld1.16 {q14-q15},[r1,:128] 205 vtrn.32 q13, q15 222 vadd.i16 q1, q15, q9 223 vsub.i16 qa, q15, q9 225 vsub.i16 q0, q0, q15 232 vshr.s16 q15, q15, #1 233 vsub.i16 q0, q0, q15 [all …]
|
D | vp3dsp_neon.S | 43 vdup.u16 q15, r2 47 vqsub.u16 q2, q15, q1 155 vadd.s16 q2, q2, q15 // ip[7] * C1 157 vsub.s16 q15, q4, q2 // B = ip[1] * C7 - ip[7] * C1 193 vsub.s16 q9, q15, q13 // (B - D) 194 vadd.s16 q13, q15, q13 // Dd = B + D 195 vadd.s16 q15, q3, q4 // G = ip[2] * C2 + ip[6] * C6 227 vadd.s16 q2, q12, q15 // Gd = E + G 229 vsub.s16 q12, q12, q15 // Ed = E - G 235 vsub.s16 q15, q2, q11 // [7] = Gd - Cd [all …]
|
D | vc1dsp_neon.S | 144 vshl.i16 q15, q2, #4 @ t3|t4 = 16 * (src[16]|src[48]) 151 vmla.i16 q15, q2, d0[1] @ t3|t4 += 6 * (src[48]|src[16]) 159 @ q15 old t3|t4 175 vsub.i16 q11, q14, q15 @ t8|t7 = old t1|t2 - old t3|t4 176 vadd.i16 q10, q14, q15 @ t5|t6 = old t1|t2 + old t3|t4 178 vmov.i16 q15, #1 199 @ #1 q15 202 vadd.i16 q3, q15, q10 @ line[7,6] = t5|t6 + 1 203 vadd.i16 q2, q15, q11 @ line[5,4] = t7|t8 + 1 235 @ Input columns: q8, q9, q10, q11, q12, q13, q14, q15 [all …]
|
D | fft_neon.S | 130 vld1.32 {d28-d31}, [r0,:128] @ q14{r12,i12,r13,i13} q15{r14,i14,r15,i15} 139 vext.32 q15, q15, q15, #1 143 vswp d29, d30 @ q14{r12,i12,i14,r15} q15{r13,i13,i15,r14} 145 vadd.f32 q1, q14, q15 @ {t1a,t2a,t5a,t6a} 149 vsub.f32 q15, q14, q15 @ {t3a,t4a,t7a,t8a} 153 vswp d3, d30 @ q1{t1a,t2a,t3a,t4a} q15{t6a,t5a,t7a,t8a} 155 vadd.f32 q14, q1, q15 @ {r12,i12,r13,i13} 158 vsub.f32 q15, q1, q15 @ {r14,i14,r15,i15} 165 vswp d27, d30 @ q13{r10,i10,r14,i14} q15{r11,i11,r15,i15} 178 vrev64.32 q1, q15 [all …]
|
D | sbcdsp_neon.S | 229 vmov.s32 q15, #16 @ 31 - SCALE_OUT_BITS 249 vsub.s32 q0, q15, q0 330 vbif.s32 q10, q9, q15 354 vbif.s32 q10, q9, q15 361 vbif.s32 q2, q1, q15 363 vbif.s32 q3, q0, q15 406 vadd.s32 q15, q0, q1 410 vcgt.s32 q15, q15, q9 414 vand.s32 q8, q8, q15 415 vbit.s32 q0, q2, q15 [all …]
|
D | vp9itxfm_16bpp_neon.S | 615 vmov q15, q11 675 load_add_store q12, q13, q14, q15 730 @ For all-zero slices in pass 1, set q12-q15 to zero, for the in-register 735 vmov.i32 q15, #0 798 vdup.s16 q15, r9 821 vmin.u16 q0, q0, q15 822 vmin.u16 q1, q1, q15 826 vmin.u16 q2, q2, q15 827 vmin.u16 q3, q3, q15 845 mbutterfly0 d27, d21, d27, d21, d16, d30, q8, q15 @ d27 = t13a, d21 = t10a [all …]
|
/third_party/openh264/codec/encoder/core/arm/ |
D | pixel_neon.S | 62 vsubl.u8 q15, d5, d7 70 vadd.s16 q10, q14, q15 71 vsub.s16 q11, q14, q15 77 vsub.s16 q15, q8, q10 86 vtrn.16 q13, q15 91 vadd.s16 q9, q13, q15 92 vabd.s16 q11, q13, q15 104 vabd.s16 q15, q1, q3 113 vtrn.32 q13, q15 118 vmax.s16 q3, q13, q15 [all …]
|
/third_party/cmsis/CMSIS/DSP/Source/ |
D | CMakeLists.txt | 61 option(ARM_COS_Q15 "cos q15" OFF) 64 option(ARM_SIN_Q15 "sin q15" OFF) 69 option(ARM_LMS_NORM_Q15 "lms norm q15" OFF) 101 option(CFFT_Q15_16 "cfft q15 16" OFF) 102 option(CFFT_Q15_32 "cfft q15 32" OFF) 103 option(CFFT_Q15_64 "cfft q15 64" OFF) 104 option(CFFT_Q15_128 "cfft q15 128" OFF) 105 option(CFFT_Q15_256 "cfft q15 256" OFF) 106 option(CFFT_Q15_512 "cfft q15 512" OFF) 107 option(CFFT_Q15_1024 "cfft q15 1024" OFF) [all …]
|
/third_party/ffmpeg/libswscale/arm/ |
D | yuv2rgb_neon.S | 27 …vsub.u16 q15,q11 @ q15 = V * (1 << 3) - 128 * (1… 28 vqdmulh.s16 q8, q15, d1[0] @ q8 = V * v2r 30 vqdmulh.s16 q5, q15, d1[2] @ q5 = V * v2g 37 vadd.s16 q2, q15, \pre 52 vshll.u8 q15, d15, #3 @ q15 = Y * (1 << 3) 54 vsub.s16 q15, q12 @ q15 = (Y - y_offset) 56 …vqdmulh.s16 q15, q13 @ q15 = (Y - y_offset) * y_coeff 168 vshll.u8 q15, d3, #3 @ q15 = V * (1 << 3) 176 vshll.u8 q15, d2, #3 @ q15 = V * (1 << 3) 186 vshll.u8 q15, d3, #3 @ q15 = V * (1 << 3) [all …]
|
/third_party/cmsis/CMSIS/DSP/Source/TransformFunctions/ |
D | arm_cfft_init_q15.c | 282 FFTINIT(q15,4096); in arm_cfft_init_q15() 290 FFTINIT(q15,2048); in arm_cfft_init_q15() 299 FFTINIT(q15,1024); in arm_cfft_init_q15() 308 FFTINIT(q15,512); in arm_cfft_init_q15() 314 FFTINIT(q15,256); in arm_cfft_init_q15() 320 FFTINIT(q15,128); in arm_cfft_init_q15() 326 FFTINIT(q15,64); in arm_cfft_init_q15() 332 FFTINIT(q15,32); in arm_cfft_init_q15() 339 FFTINIT(q15,16); in arm_cfft_init_q15()
|
/third_party/libjpeg-turbo/simd/arm/ |
D | jsimd_neon.S | 263 vmul.s16 q15, q15, q3 517 vqrshrn.s16 d23, q15, #2 751 vmul.s16 q15, q15, q3 758 vsub.s16 q5, q9, q15 759 vadd.s16 q15, q9, q15 766 vsub.s16 q2, q15, q13 778 vadd.s16 q6, q15, q13 785 vsub.s16 q15, q8, q6 795 vtrn.16 q14, q15 802 vtrn.32 q13, q15 [all …]
|
/third_party/flutter/skia/third_party/externals/libjpeg-turbo/simd/arm/ |
D | jsimd_neon.S | 263 vmul.s16 q15, q15, q3 517 vqrshrn.s16 d23, q15, #2 751 vmul.s16 q15, q15, q3 758 vsub.s16 q5, q9, q15 759 vadd.s16 q15, q9, q15 766 vsub.s16 q2, q15, q13 778 vadd.s16 q6, q15, q13 785 vsub.s16 q15, q8, q6 795 vtrn.16 q14, q15 802 vtrn.32 q13, q15 [all …]
|
/third_party/pixman/pixman/ |
D | pixman-arm-neon-asm.S | 172 vrshr.u16 q15, q12, #8 175 vraddhn.u16 d22, q12, q15 283 vrshr.u16 q15, q12, #8 290 vraddhn.u16 d22, q12, q15 370 vrshr.u16 q15, q12, #8 373 vraddhn.u16 d22, q12, q15 504 vqadd.u8 q15, q1, q3 526 vqadd.u8 q15, q1, q3 558 vqadd.u8 q15, q1, q3 595 vrshr.u16 q15, q9, #8 [all …]
|
/third_party/openssl/crypto/aes/asm/arm32/ |
D | bsaes-armv7.S | 1109 vstmia r12, {q15} @ save last round key 1125 vstmia r12, {q15} @ save last round key 1133 vld1.8 {q15}, [r8] @ load IV 1152 vstmia r9, {q15} @ put aside IV 1165 vld1.8 {q14-q15}, [r0]! 1193 vstmia r9, {q15} @ put aside IV 1219 vld1.8 {q15}, [r0]! 1242 vld1.8 {q15}, [r0]! 1260 vld1.8 {q15}, [r0]! 1278 vld1.8 {q15}, [r0]! [all …]
|