首页 > 其他 > 详细

CUDA的计时方法

时间:2014-02-26 06:02:14      阅读:519      评论:0      收藏:0      [点我收藏+]

CUDA Runtime API提供了用于计时的接口,可以用如下代码对在GPU上运行的CUDA程序进行计时,计时结果以毫秒为单位:

cudaEvent_t start, stop;
cudaEventCreate(&start);    
cudaEventCreate(&stop);  
cudaEventRecord(start, 0);

//需要计时的在GPU上运行的程序

cudaEventRecord(stop, 0); 
cudaEventSynchronize(stop);
float kernelTime;
cudaEventElapsedTime(&kernelTime, start, stop);
cudaEventDestroy(start);
cudaEventDestroy(stop);
printf("Kernel time: %.2f ms\n", kernelTime);


需要注意的是函数cudaEventSynchronize() 不可或缺,因为CUDA的kernel函数是以异步方式执行的,调用后立刻返回,这会导致计时不准确。cudaEventSynchronize(stop)会使得直到GPU执行完cudaEventRecord(stop, 0)之前的所有语句时,事件stop才会被记录下来,即起到同步的作用。

CUDA的计时方法

原文:http://blog.csdn.net/warren912/article/details/19920111

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!