请先看一段教程: 到目前为止,我们的程序并没有做什么有用的工作。所以,现在我们加入一个简单的动作,就是把一大堆数字,计算出它的平方和。 首先,把程序最前面的 include 部份改成: #include<stdio.h>#include<stdlib.h>#include<cuda_runtime.h>#defineDATA_SIZE 1048576i...