1 #include <cuda.h> 2 #include <cuda_runtime.h> 3 add(const float * a,const float * b,float * output)4 __device__ void add(const float* a, const float* b, float* output) { 5 *output = *a + *b; 6 } 7