CUB为CUDA编程模式的每一层提供了最新的可重用软件组件。
C++11的快速多生产者、多消费者的无锁并发队列。
适用于任何规模的并行分布式应用的通用C++运行时系统。
并发数据结构的C++库。
轻量级的现代C++封装器,用于CUDA GPU的运行时API编程。
在C中引入结构并发性。
用于OpenCL/CUDA 的C++向量表达式模板库。