CUB为CUDA编程模式的每一层提供了最新的可重用软件组件。
具有任务依赖性的快速C++并行编程。
C++11的快速多生产者、多消费者的无锁并发队列。
并发基元,安全内存回收机制和非阻塞数据结构。
针对GPU进行优化的C++模板库。
用于OpenCL的C++GPU计算库。
C++ 11 的轻量级并行框架,受Microsoft PPL库和N3428 C++标准提案启发。
通用GPU库。
并行内核加速的抽象库。