Lines Matching refs:__m256
48 typedef float __m256 __attribute__ ((__vector_size__ (32))); typedef
86 static __inline __m256 __DEFAULT_FN_ATTRS
87 _mm256_add_ps(__m256 __a, __m256 __b) in _mm256_add_ps()
89 return (__m256)((__v8sf)__a+(__v8sf)__b); in _mm256_add_ps()
122 static __inline __m256 __DEFAULT_FN_ATTRS
123 _mm256_sub_ps(__m256 __a, __m256 __b) in _mm256_sub_ps()
125 return (__m256)((__v8sf)__a-(__v8sf)__b); in _mm256_sub_ps()
160 static __inline __m256 __DEFAULT_FN_ATTRS
161 _mm256_addsub_ps(__m256 __a, __m256 __b) in _mm256_addsub_ps()
163 return (__m256)__builtin_ia32_addsubps256((__v8sf)__a, (__v8sf)__b); in _mm256_addsub_ps()
196 static __inline __m256 __DEFAULT_FN_ATTRS
197 _mm256_div_ps(__m256 __a, __m256 __b) in _mm256_div_ps()
199 return (__m256)((__v8sf)__a/(__v8sf)__b); in _mm256_div_ps()
234 static __inline __m256 __DEFAULT_FN_ATTRS
235 _mm256_max_ps(__m256 __a, __m256 __b) in _mm256_max_ps()
237 return (__m256)__builtin_ia32_maxps256((__v8sf)__a, (__v8sf)__b); in _mm256_max_ps()
272 static __inline __m256 __DEFAULT_FN_ATTRS
273 _mm256_min_ps(__m256 __a, __m256 __b) in _mm256_min_ps()
275 return (__m256)__builtin_ia32_minps256((__v8sf)__a, (__v8sf)__b); in _mm256_min_ps()
308 static __inline __m256 __DEFAULT_FN_ATTRS
309 _mm256_mul_ps(__m256 __a, __m256 __b) in _mm256_mul_ps()
311 return (__m256)((__v8sf)__a * (__v8sf)__b); in _mm256_mul_ps()
342 static __inline __m256 __DEFAULT_FN_ATTRS
343 _mm256_sqrt_ps(__m256 __a) in _mm256_sqrt_ps()
345 return (__m256)__builtin_ia32_sqrtps256((__v8sf)__a); in _mm256_sqrt_ps()
359 static __inline __m256 __DEFAULT_FN_ATTRS
360 _mm256_rsqrt_ps(__m256 __a) in _mm256_rsqrt_ps()
362 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)__a); in _mm256_rsqrt_ps()
376 static __inline __m256 __DEFAULT_FN_ATTRS
377 _mm256_rcp_ps(__m256 __a) in _mm256_rcp_ps()
379 return (__m256)__builtin_ia32_rcpps256((__v8sf)__a); in _mm256_rcp_ps()
444 (__m256)__builtin_ia32_roundps256((__v8sf)(__m256)(V), (M)); })
546 static __inline __m256 __DEFAULT_FN_ATTRS
547 _mm256_and_ps(__m256 __a, __m256 __b) in _mm256_and_ps()
549 return (__m256)((__v8su)__a & (__v8su)__b); in _mm256_and_ps()
588 static __inline __m256 __DEFAULT_FN_ATTRS
589 _mm256_andnot_ps(__m256 __a, __m256 __b) in _mm256_andnot_ps()
591 return (__m256)(~(__v8su)__a & (__v8su)__b); in _mm256_andnot_ps()
624 static __inline __m256 __DEFAULT_FN_ATTRS
625 _mm256_or_ps(__m256 __a, __m256 __b) in _mm256_or_ps()
627 return (__m256)((__v8su)__a | (__v8su)__b); in _mm256_or_ps()
660 static __inline __m256 __DEFAULT_FN_ATTRS
661 _mm256_xor_ps(__m256 __a, __m256 __b) in _mm256_xor_ps()
663 return (__m256)((__v8su)__a ^ (__v8su)__b); in _mm256_xor_ps()
707 static __inline __m256 __DEFAULT_FN_ATTRS
708 _mm256_hadd_ps(__m256 __a, __m256 __b) in _mm256_hadd_ps()
710 return (__m256)__builtin_ia32_haddps256((__v8sf)__a, (__v8sf)__b); in _mm256_hadd_ps()
753 static __inline __m256 __DEFAULT_FN_ATTRS
754 _mm256_hsub_ps(__m256 __a, __m256 __b) in _mm256_hsub_ps()
756 return (__m256)__builtin_ia32_hsubps256((__v8sf)__a, (__v8sf)__b); in _mm256_hsub_ps()
968 static __inline __m256 __DEFAULT_FN_ATTRS
969 _mm256_permutevar_ps(__m256 __a, __m256i __c) in _mm256_permutevar_ps()
971 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)__a, (__v8si)__c); in _mm256_permutevar_ps()
1196 (__m256)__builtin_shufflevector((__v8sf)(__m256)(A), \
1286 (__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)(__m256)(V1), \
1287 (__v8sf)(__m256)(V2), (M)); })
1387 (__m256)__builtin_shufflevector((__v8sf)(__m256)(V1), \
1388 (__v8sf)(__m256)(V2), \
1447 static __inline __m256 __DEFAULT_FN_ATTRS
1448 _mm256_blendv_ps(__m256 __a, __m256 __b, __m256 __c) in _mm256_blendv_ps()
1450 return (__m256)__builtin_ia32_blendvps256( in _mm256_blendv_ps()
1492 (__m256)__builtin_ia32_dpps256((__v8sf)(__m256)(V1), \
1493 (__v8sf)(__m256)(V2), (M)); })
1544 (__m256)__builtin_shufflevector((__v8sf)(__m256)(a), \
1545 (__v8sf)(__m256)(b), \
1779 (__m256)__builtin_ia32_cmpps256((__v8sf)(__m256)(a), \
1780 (__v8sf)(__m256)(b), (c)); })
2074 static __inline __m256 __DEFAULT_FN_ATTRS
2077 return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) __a); in _mm256_cvtepi32_ps()
2106 _mm256_cvtps_epi32(__m256 __a) in _mm256_cvtps_epi32()
2130 _mm256_cvttps_epi32(__m256 __a) in _mm256_cvttps_epi32()
2149 _mm256_cvtss_f32(__m256 __a) in _mm256_cvtss_f32()
2155 static __inline __m256 __DEFAULT_FN_ATTRS
2156 _mm256_movehdup_ps(__m256 __a) in _mm256_movehdup_ps()
2161 static __inline __m256 __DEFAULT_FN_ATTRS
2162 _mm256_moveldup_ps(__m256 __a) in _mm256_moveldup_ps()
2186 static __inline __m256 __DEFAULT_FN_ATTRS
2187 _mm256_unpackhi_ps(__m256 __a, __m256 __b) in _mm256_unpackhi_ps()
2192 static __inline __m256 __DEFAULT_FN_ATTRS
2193 _mm256_unpacklo_ps(__m256 __a, __m256 __b) in _mm256_unpacklo_ps()
2254 _mm256_testz_ps(__m256 __a, __m256 __b) in _mm256_testz_ps()
2260 _mm256_testc_ps(__m256 __a, __m256 __b) in _mm256_testc_ps()
2266 _mm256_testnzc_ps(__m256 __a, __m256 __b) in _mm256_testnzc_ps()
2297 _mm256_movemask_ps(__m256 __a) in _mm256_movemask_ps()
2330 static __inline __m256 __DEFAULT_FN_ATTRS
2334 return (__m256)(__v8sf){ __f, __f, __f, __f, __f, __f, __f, __f }; in _mm256_broadcast_ss()
2343 static __inline __m256 __DEFAULT_FN_ATTRS
2346 return (__m256)__builtin_ia32_vbroadcastf128_ps256((__v4sf const *)__a); in _mm256_broadcast_ps()
2356 static __inline __m256 __DEFAULT_FN_ATTRS
2359 return *(__m256 *)__p; in _mm256_load_ps()
2371 static __inline __m256 __DEFAULT_FN_ATTRS
2375 __m256 __v; in _mm256_loadu_ps()
2409 _mm256_store_ps(float *__p, __m256 __a) in _mm256_store_ps()
2411 *(__m256 *)__p = __a; in _mm256_store_ps()
2424 _mm256_storeu_ps(float *__p, __m256 __a) in _mm256_storeu_ps()
2427 __m256 __v; in _mm256_storeu_ps()
2467 static __inline __m256 __DEFAULT_FN_ATTRS
2470 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)__p, (__v8si)__m); in _mm256_maskload_ps()
2475 _mm256_maskstore_ps(float *__p, __m256i __m, __m256 __a) in _mm256_maskstore_ps()
2512 _mm256_stream_ps(float *__p, __m256 __a) in _mm256_stream_ps()
2524 static __inline__ __m256 __DEFAULT_FN_ATTRS
2527 return (__m256)__builtin_ia32_undef256(); in _mm256_undefined_ps()
2542 static __inline __m256 __DEFAULT_FN_ATTRS
2546 return (__m256){ __h, __g, __f, __e, __d, __c, __b, __a }; in _mm256_set_ps()
2597 static __inline __m256 __DEFAULT_FN_ATTRS
2601 return (__m256){ __a, __b, __c, __d, __e, __f, __g, __h }; in _mm256_setr_ps()
2651 static __inline __m256 __DEFAULT_FN_ATTRS
2654 return (__m256){ __w, __w, __w, __w, __w, __w, __w, __w }; in _mm256_set1_ps()
2691 static __inline __m256 __DEFAULT_FN_ATTRS
2694 return (__m256){ 0, 0, 0, 0, 0, 0, 0, 0 }; in _mm256_setzero_ps()
2704 static __inline __m256 __DEFAULT_FN_ATTRS
2707 return (__m256)__a; in _mm256_castpd_ps()
2717 _mm256_castps_pd(__m256 __a) in _mm256_castps_pd()
2723 _mm256_castps_si256(__m256 __a) in _mm256_castps_si256()
2728 static __inline __m256 __DEFAULT_FN_ATTRS
2731 return (__m256)__a; in _mm256_castsi256_ps()
2747 _mm256_castps256_ps128(__m256 __a) in _mm256_castps256_ps128()
2764 static __inline __m256 __DEFAULT_FN_ATTRS
2782 (__m256)__builtin_shufflevector( \
2783 (__v8sf)(__m256)(V1), \
2819 (__v8sf)(__m256)(V), \
2841 static __inline __m256 __DEFAULT_FN_ATTRS
2844 __m256 __v256 = _mm256_castps128_ps256(_mm_loadu_ps(__addr_lo)); in _mm256_loadu2_m128()
2864 _mm256_storeu2_m128(float *__addr_hi, float *__addr_lo, __m256 __a) in _mm256_storeu2_m128()
2896 static __inline __m256 __DEFAULT_FN_ATTRS
2898 return (__m256) __builtin_shufflevector((__v4sf)__lo, (__v4sf)__hi, 0, 1, 2, 3, 4, 5, 6, 7); in _mm256_set_m128()
2911 static __inline __m256 __DEFAULT_FN_ATTRS