kBlockM (definition) in projects: external

Searched defs:kBlockM (Results 1 – 5 of 5) sorted by relevance

/external/pytorch/aten/src/ATen/native/transformers/cuda/flash_attn/
D	flash_fwd_launch_template.h	`52 DEFINE_FLASH_FORWARD_KERNEL(flash_fwd_splitkv_combine_kernel, int kBlockM, int Log_max_splits, bool… in DEFINE_FLASH_FORWARD_KERNEL() 141 …constexpr static int kBlockM = Kernel_traits::kHeadDim % 128 == 0 ? 4 : (Kernel_traits::kHeadDim %… in run_flash_splitkv_fwd() local 166 constexpr static int kBlockM = 64; // Fixed for all head dimensions in run_mha_fwd_splitkv_dispatch() local`
D	flash_bwd_preprocess_kernel.h	`70 constexpr int kBlockM = Kernel_traits::kBlockM; in compute_dot_do_o() local 197 constexpr int kBlockM = Kernel_traits::kBlockM; in convert_dQ() local`
D	kernel_traits.h	`68 static constexpr int kBlockM = kBlockM_; member 184 static constexpr int kBlockM = kBlockM_; member`
D	flash_bwd_kernel.h	`92 constexpr int kBlockM = Kernel_traits::kBlockM; in compute_dq_dk_dv_1colblock() local 513 …if (m_block * kBlockM < (n_block + 1) * kBlockN + binfo.actual_seqlen_q - binfo.actual_seqlen_k - … in compute_dq_dk_dv_1colblock() local`
D	flash_fwd_kernel.h	`41 constexpr int kBlockM = Kernel_traits::kBlockM; in compute_attn_1rowblock() local 491 constexpr int kBlockM = Kernel_traits::kBlockM; in compute_attn_1rowblock_splitkv() local`