tips:cuda:start
文書の過去の版を表示しています。
CUDA
基本事項
- GPU 上で動く関数には
__global__または__device__が付いている。 __global__は C++ から直接呼び出す用の関数で__device__は__global__の関数内から呼び出される関数だと思う。cudaMallocで確保した GPUメモリにcudaMemcpyでCPU側からデータを移して- CUDAの関数を呼び出して実行されたら
cudaMemcpyでCPU側のメモリにデータを移す。 - CUDAの関数(カーネル)は関数名の後に
<<<grid, threads>>>というテンプレート的な表記のものが付くのでわかりやすい。
CUDAにおける配列
Grid の中には複数の Block があり、Block の中には複数の thread がある。
画素の座標を知るには?
頻出データ構造/関数
dim3cudaMalloccudaMemcpycudaMemcpyHostToDevicecudaMemcpyDeviceToHost
cudaFree
cudaGetDeviceCountcudaSetDevice
tips/cuda/start.1631797849.txt.gz · 最終更新: 2021/09/16 13:10 by yuuho
