/external/XNNPACK/src/qs8-gemm/gen/ |
D | 1x8c8-xw-minmax-avx2.c | 102 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_gemm_xw_minmax_ukernel_1x8c8__avx2() local 106 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_gemm_xw_minmax_ukernel_1x8c8__avx2() 111 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_gemm_xw_minmax_ukernel_1x8c8__avx2()
|
D | 1x8c8-minmax-avx2.c | 106 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_gemm_minmax_ukernel_1x8c8__avx2() local 110 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_gemm_minmax_ukernel_1x8c8__avx2() 115 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_gemm_minmax_ukernel_1x8c8__avx2()
|
D | 2x8c8-xw-minmax-avx2.c | 128 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_gemm_xw_minmax_ukernel_2x8c8__avx2() local 133 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_gemm_xw_minmax_ukernel_2x8c8__avx2() 140 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_gemm_xw_minmax_ukernel_2x8c8__avx2()
|
D | 2x8c8-minmax-avx2.c | 132 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_gemm_minmax_ukernel_2x8c8__avx2() local 137 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_gemm_minmax_ukernel_2x8c8__avx2() 144 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_gemm_minmax_ukernel_2x8c8__avx2()
|
D | 3x8c8-minmax-avx2.c | 158 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_gemm_minmax_ukernel_3x8c8__avx2() local 164 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_gemm_minmax_ukernel_3x8c8__avx2() 173 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_gemm_minmax_ukernel_3x8c8__avx2()
|
D | 3x8c8-xw-minmax-avx2.c | 154 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_gemm_xw_minmax_ukernel_3x8c8__avx2() local 160 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_gemm_xw_minmax_ukernel_3x8c8__avx2() 169 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_gemm_xw_minmax_ukernel_3x8c8__avx2()
|
/external/XNNPACK/src/qs8-igemm/gen/ |
D | 1x8c8-minmax-avx2.c | 119 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_igemm_minmax_ukernel_1x8c8__avx2() local 123 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_igemm_minmax_ukernel_1x8c8__avx2() 128 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_igemm_minmax_ukernel_1x8c8__avx2()
|
D | 2x8c8-minmax-avx2.c | 147 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_igemm_minmax_ukernel_2x8c8__avx2() local 152 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_igemm_minmax_ukernel_2x8c8__avx2() 159 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_igemm_minmax_ukernel_2x8c8__avx2()
|
D | 3x8c8-minmax-avx2.c | 175 const __m256i vq31prod0x01234567 = _mm256_blend_epi16(vq31prod0x0246, vq31prod0x1357, 0xCC); in xnn_qs8_igemm_minmax_ukernel_3x8c8__avx2() local 181 …add_epi32(_mm256_and_si256(vq31prod0x01234567, vremainder_mask), _mm256_cmpgt_epi32(_mm256_setzero… in xnn_qs8_igemm_minmax_ukernel_3x8c8__avx2() 190 …_mm256_sub_epi32(_mm256_sra_epi32(vq31prod0x01234567, vshift), _mm256_cmpgt_epi32(vrem0x01234567, … in xnn_qs8_igemm_minmax_ukernel_3x8c8__avx2()
|