D | tensor_benchmarks_fp16_gpu.cu | 10 #define BM_FuncGPU(FUNC) \ argument 11 static void BM_##FUNC(int iters, int N) { \ 17 suite.FUNC(iters); \ 19 BENCHMARK_RANGE(BM_##FUNC, 10, 5000); 40 #define BM_FuncWithInputDimsGPU(FUNC, D1, D2, D3) \ argument 41 static void BM_##FUNC##_##D1##x##D2##x##D3(int iters, int N) { \ 47 suite.FUNC(iters); \ 49 BENCHMARK_RANGE(BM_##FUNC##_##D1##x##D2##x##D3, 10, 5000); 59 #define BM_FuncWithKernelDimsGPU(FUNC, DIM1, DIM2) \ argument 60 static void BM_##FUNC##_##DIM1##x##DIM2(int iters, int N) { \ [all …]
|