Lines Matching refs:vreinterpretq_f32_m128
177 #define vreinterpretq_f32_m128(x) (x) macro
419 return vgetq_lane_f32(vreinterpretq_f32_m128(a), 0); in _mm_cvtss_f32()
678 vst1q_f32(p, vreinterpretq_f32_m128(a)); in _mm_store_ps()
685 vst1q_f32(p, vreinterpretq_f32_m128(a)); in _mm_storeu_ps()
706 vst1q_lane_f32(p, vreinterpretq_f32_m128(a), 0); in _mm_store_ss()
976 vsetq_lane_f32(vgetq_lane_f32(vreinterpretq_f32_m128(b), 0), in _mm_move_ss()
977 vreinterpretq_f32_m128(a), 0)); in _mm_move_ss()
1149 vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a), 1, 1, 3, 3)); in _mm_movehdup_ps()
1151 float32_t a1 = vgetq_lane_f32(vreinterpretq_f32_m128(a), 1); in _mm_movehdup_ps()
1152 float32_t a3 = vgetq_lane_f32(vreinterpretq_f32_m128(a), 3); in _mm_movehdup_ps()
1165 vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a), 0, 0, 2, 2)); in _mm_moveldup_ps()
1167 float32_t a0 = vgetq_lane_f32(vreinterpretq_f32_m128(a), 0); in _mm_moveldup_ps()
1168 float32_t a2 = vgetq_lane_f32(vreinterpretq_f32_m128(a), 2); in _mm_moveldup_ps()
1182 float32x2_t a32 = vget_high_f32(vreinterpretq_f32_m128(__A)); in _mm_movehl_ps()
1183 float32x2_t b32 = vget_high_f32(vreinterpretq_f32_m128(__B)); in _mm_movehl_ps()
1195 float32x2_t a10 = vget_low_f32(vreinterpretq_f32_m128(__A)); in _mm_movelh_ps()
1196 float32x2_t b10 = vget_low_f32(vreinterpretq_f32_m128(__B)); in _mm_movelh_ps()
1288 float32x2_t a32 = vget_high_f32(vreinterpretq_f32_m128(a)); in _mm_shuffle_ps_1032()
1289 float32x2_t b10 = vget_low_f32(vreinterpretq_f32_m128(b)); in _mm_shuffle_ps_1032()
1298 float32x2_t a01 = vrev64_f32(vget_low_f32(vreinterpretq_f32_m128(a))); in _mm_shuffle_ps_2301()
1299 float32x2_t b23 = vrev64_f32(vget_high_f32(vreinterpretq_f32_m128(b))); in _mm_shuffle_ps_2301()
1306 vextq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a), 3)); in _mm_shuffle_ps_0321()
1308 vextq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b), 3)); in _mm_shuffle_ps_0321()
1315 vextq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a), 3)); in _mm_shuffle_ps_2103()
1317 vextq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b), 3)); in _mm_shuffle_ps_2103()
1323 float32x2_t a10 = vget_low_f32(vreinterpretq_f32_m128(a)); in _mm_shuffle_ps_1010()
1324 float32x2_t b10 = vget_low_f32(vreinterpretq_f32_m128(b)); in _mm_shuffle_ps_1010()
1330 float32x2_t a01 = vrev64_f32(vget_low_f32(vreinterpretq_f32_m128(a))); in _mm_shuffle_ps_1001()
1331 float32x2_t b10 = vget_low_f32(vreinterpretq_f32_m128(b)); in _mm_shuffle_ps_1001()
1337 float32x2_t a01 = vrev64_f32(vget_low_f32(vreinterpretq_f32_m128(a))); in _mm_shuffle_ps_0101()
1338 float32x2_t b01 = vrev64_f32(vget_low_f32(vreinterpretq_f32_m128(b))); in _mm_shuffle_ps_0101()
1346 float32x2_t a10 = vget_low_f32(vreinterpretq_f32_m128(a)); in _mm_shuffle_ps_3210()
1347 float32x2_t b32 = vget_high_f32(vreinterpretq_f32_m128(b)); in _mm_shuffle_ps_3210()
1353 float32x2_t a11 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(a)), 1); in _mm_shuffle_ps_0011()
1354 float32x2_t b00 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(b)), 0); in _mm_shuffle_ps_0011()
1361 vdup_lane_f32(vget_high_f32(vreinterpretq_f32_m128(a)), 0); in _mm_shuffle_ps_0022()
1362 float32x2_t b00 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(b)), 0); in _mm_shuffle_ps_0022()
1368 float32x2_t a00 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(a)), 0); in _mm_shuffle_ps_2200()
1370 vdup_lane_f32(vget_high_f32(vreinterpretq_f32_m128(b)), 0); in _mm_shuffle_ps_2200()
1376 float32_t a0 = vgetq_lane_f32(vreinterpretq_f32_m128(a), 0); in _mm_shuffle_ps_3202()
1378 vdup_lane_f32(vget_high_f32(vreinterpretq_f32_m128(a)), 0); in _mm_shuffle_ps_3202()
1380 float32x2_t b32 = vget_high_f32(vreinterpretq_f32_m128(b)); in _mm_shuffle_ps_3202()
1387 vdup_lane_f32(vget_high_f32(vreinterpretq_f32_m128(a)), 1); in _mm_shuffle_ps_1133()
1388 float32x2_t b11 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(b)), 1); in _mm_shuffle_ps_1133()
1394 float32x2_t a10 = vget_low_f32(vreinterpretq_f32_m128(a)); in _mm_shuffle_ps_2010()
1395 float32_t b2 = vgetq_lane_f32(vreinterpretq_f32_m128(b), 2); in _mm_shuffle_ps_2010()
1396 float32x2_t b00 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(b)), 0); in _mm_shuffle_ps_2010()
1403 float32x2_t a01 = vrev64_f32(vget_low_f32(vreinterpretq_f32_m128(a))); in _mm_shuffle_ps_2001()
1405 float32x2_t b00 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(b)), 0); in _mm_shuffle_ps_2001()
1412 float32x2_t a32 = vget_high_f32(vreinterpretq_f32_m128(a)); in _mm_shuffle_ps_2032()
1414 float32x2_t b00 = vdup_lane_f32(vget_low_f32(vreinterpretq_f32_m128(b)), 0); in _mm_shuffle_ps_2032()
1437 vgetq_lane_f32(vreinterpretq_f32_m128(a), (imm) & (0x3))); \
1439 vgetq_lane_f32(vreinterpretq_f32_m128(a), ((imm) >> 2) & 0x3), \
1442 vgetq_lane_f32(vreinterpretq_f32_m128(b), ((imm) >> 4) & 0x3), \
1445 vgetq_lane_f32(vreinterpretq_f32_m128(b), ((imm) >> 6) & 0x3), \
1455 float32x4_t _input1 = vreinterpretq_f32_m128(a); \
1456 float32x4_t _input2 = vreinterpretq_f32_m128(b); \
2370 vsubq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_sub_ps()
2825 vaddq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_add_ps()
2861 float32_t b0 = vgetq_lane_f32(vreinterpretq_f32_m128(b), 0); in _mm_add_ss()
2996 vmulq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_mul_ps()
3152 return vreinterpretq_m128_f32(vfmaq_f32(vreinterpretq_f32_m128(c), in _mm_fmadd_ps()
3153 vreinterpretq_f32_m128(b), in _mm_fmadd_ps()
3154 vreinterpretq_f32_m128(a))); in _mm_fmadd_ps()
3225 vdivq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_div_ps()
3227 float32x4_t recip0 = vrecpeq_f32(vreinterpretq_f32_m128(b)); in _mm_div_ps()
3229 vmulq_f32(recip0, vrecpsq_f32(recip0, vreinterpretq_f32_m128(b))); in _mm_div_ps()
3230 return vreinterpretq_m128_f32(vmulq_f32(vreinterpretq_f32_m128(a), recip1)); in _mm_div_ps()
3239 vgetq_lane_f32(vreinterpretq_f32_m128(_mm_div_ps(a, b)), 0); in _mm_div_ss()
3241 vsetq_lane_f32(value, vreinterpretq_f32_m128(a), 0)); in _mm_div_ss()
3249 float32x4_t recip = vrecpeq_f32(vreinterpretq_f32_m128(in)); in _mm_rcp_ps()
3250 recip = vmulq_f32(recip, vrecpsq_f32(recip, vreinterpretq_f32_m128(in))); in _mm_rcp_ps()
3281 return vreinterpretq_m128_f32(vsqrtq_f32(vreinterpretq_f32_m128(in))); in _mm_sqrt_ps()
3283 float32x4_t recipsq = vrsqrteq_f32(vreinterpretq_f32_m128(in)); in _mm_sqrt_ps()
3296 vgetq_lane_f32(vreinterpretq_f32_m128(_mm_sqrt_ps(in)), 0); in _mm_sqrt_ss()
3298 vsetq_lane_f32(value, vreinterpretq_f32_m128(in), 0)); in _mm_sqrt_ss()
3306 return vreinterpretq_m128_f32(vrsqrteq_f32(vreinterpretq_f32_m128(in))); in _mm_rsqrt_ps()
3351 float32x4_t _a = vreinterpretq_f32_m128(a); in _mm_max_ps()
3352 float32x4_t _b = vreinterpretq_f32_m128(b); in _mm_max_ps()
3356 vmaxq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_max_ps()
3418 float32x4_t _a = vreinterpretq_f32_m128(a); in _mm_min_ps()
3419 float32x4_t _b = vreinterpretq_f32_m128(b); in _mm_min_ps()
3423 vminq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_min_ps()
3460 vsetq_lane_f32(value, vreinterpretq_f32_m128(a), 0)); in _mm_max_ss()
3470 vsetq_lane_f32(value, vreinterpretq_f32_m128(a), 0)); in _mm_min_ss()
3612 vpaddq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_hadd_ps()
3614 float32x2_t a10 = vget_low_f32(vreinterpretq_f32_m128(a)); in _mm_hadd_ps()
3615 float32x2_t a32 = vget_high_f32(vreinterpretq_f32_m128(a)); in _mm_hadd_ps()
3616 float32x2_t b10 = vget_low_f32(vreinterpretq_f32_m128(b)); in _mm_hadd_ps()
3617 float32x2_t b32 = vget_high_f32(vreinterpretq_f32_m128(b)); in _mm_hadd_ps()
3645 vuzp1q_f32(vreinterpretq_f32_m128(_a), vreinterpretq_f32_m128(_b)), in _mm_hsub_ps()
3646 vuzp2q_f32(vreinterpretq_f32_m128(_a), vreinterpretq_f32_m128(_b)))); in _mm_hsub_ps()
3649 vuzpq_f32(vreinterpretq_f32_m128(_a), vreinterpretq_f32_m128(_b)); in _mm_hsub_ps()
3787 float32x4_t f32a = vreinterpretq_f32_m128(a); in _mm_dp_ps()
3788 float32x4_t f32b = vreinterpretq_f32_m128(b); in _mm_dp_ps()
3819 vcltq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_cmplt_ps()
3840 vcgtq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_cmpgt_ps()
3855 vcgeq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_cmpge_ps()
3876 vcleq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_cmple_ps()
3891 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_cmpeq_ps()
3906 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b)))); in _mm_cmpneq_ps()
4137 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_cmpord_ps()
4139 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_cmpord_ps()
4155 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_cmpunord_ps()
4157 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_cmpunord_ps()
4176 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_comilt_ss()
4178 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_comilt_ss()
4181 vcltq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b)); in _mm_comilt_ss()
4193 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_comigt_ss()
4195 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_comigt_ss()
4198 vcgtq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b)); in _mm_comigt_ss()
4210 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_comile_ss()
4212 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_comile_ss()
4215 vcleq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b)); in _mm_comile_ss()
4227 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_comige_ss()
4229 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_comige_ss()
4232 vcgeq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b)); in _mm_comige_ss()
4244 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_comieq_ss()
4246 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_comieq_ss()
4249 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b)); in _mm_comieq_ss()
4261 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(a)); in _mm_comineq_ss()
4263 vceqq_f32(vreinterpretq_f32_m128(b), vreinterpretq_f32_m128(b)); in _mm_comineq_ss()
4266 vceqq_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_comineq_ss()
4296 vget_high_f32(vreinterpretq_f32_m128(a)))); in _mm_cvt_pi2ps()
4311 vsetq_lane_f32((float) b, vreinterpretq_f32_m128(ret), 0)); in _mm_cvt_si2ss()
4320 return vgetq_lane_s32(vcvtnq_s32_f32(vreinterpretq_f32_m128(a)), 0); in _mm_cvt_ss2si()
4322 float32_t data = vgetq_lane_f32(vreinterpretq_f32_m128(a), 0); in _mm_cvt_ss2si()
4365 vget_high_f32(vreinterpretq_f32_m128(a)))); in _mm_cvtpi32_ps()
4440 return vreinterpretq_m128i_s32(vcvtq_s32_f32(vreinterpretq_f32_m128(a))); in _mm_cvttps_epi32()
4581 float32x4_t half = vbslq_f32(signmask, vreinterpretq_f32_m128(a), in _mm_cvtps_epi32()
4584 vreinterpretq_f32_m128(a), half)); /* round to integer: [a + 0.5]*/ in _mm_cvtps_epi32()
4586 vcvtq_s32_f32(vreinterpretq_f32_m128(a)); /* truncate to integer: [a] */ in _mm_cvtps_epi32()
4592 vreinterpretq_f32_m128(a), in _mm_cvtps_epi32()
4806 vcvt_f64_f32(vget_low_f32(vreinterpretq_f32_m128(a)))); in _mm_cvtps_pd()
4808 double a0 = (double) vgetq_lane_f32(vreinterpretq_f32_m128(a), 0); in _mm_cvtps_pd()
4809 double a1 = (double) vgetq_lane_f32(vreinterpretq_f32_m128(a), 1); in _mm_cvtps_pd()
4828 vreinterpretq_f32_m128(b), in _mm_blendv_ps()
4829 vreinterpretq_f32_m128(a))); in _mm_blendv_ps()
4841 return vreinterpretq_m128_f32(vrndnq_f32(vreinterpretq_f32_m128(a))); in _mm_round_ps()
4843 return vreinterpretq_m128_f32(vrndmq_f32(vreinterpretq_f32_m128(a))); in _mm_round_ps()
4845 return vreinterpretq_m128_f32(vrndpq_f32(vreinterpretq_f32_m128(a))); in _mm_round_ps()
4847 return vreinterpretq_m128_f32(vrndq_f32(vreinterpretq_f32_m128(a))); in _mm_round_ps()
4849 return vreinterpretq_m128_f32(vrndiq_f32(vreinterpretq_f32_m128(a))); in _mm_round_ps()
5103 vzip1q_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_unpacklo_ps()
5105 float32x2_t a1 = vget_low_f32(vreinterpretq_f32_m128(a)); in _mm_unpacklo_ps()
5106 float32x2_t b1 = vget_low_f32(vreinterpretq_f32_m128(b)); in _mm_unpacklo_ps()
5125 vzip2q_f32(vreinterpretq_f32_m128(a), vreinterpretq_f32_m128(b))); in _mm_unpackhi_ps()
5127 float32x2_t a1 = vget_high_f32(vreinterpretq_f32_m128(a)); in _mm_unpackhi_ps()
5128 float32x2_t b1 = vget_high_f32(vreinterpretq_f32_m128(b)); in _mm_unpackhi_ps()
5816 vst1q_f32(p, vreinterpretq_f32_m128(a)); in _mm_stream_ps()