2017-12-02から1日間の記事一覧

【CUDA】Warp Sum & Warp Scan

Warp Sum 各Warpの持つ値の合計を計算する。 例:[1, 2, 3, 4] -> [10, 10, 10, 10] for (int i = 1; i < warpSize; i *= 2) value += __shfl_xor(value, i); Warp Scan 各Warpの持つ値の累積を計算する。 例:[1, 2, 3, 4] -> [1, 3, 6, 10] for (int i = 1…