【CUDA 基础】4.0 全局内存

上一章我们整个一章都在研究CUDA的执行模型,必须承认执行模型中,核的配置,决定了程序执行效率,但是程序的执行效率不只由线程束,线程块等执行结构决定,内存也严重的影响了性能。
举个例子,一个老例子,但是这个例子真的非常贴切