CUDA Runtime API 没有提供用于生成随机数的接口,但是CURAND这个库提供了通过GPU生成随机数的接口,详细内容可参考http://docs.nvidia.com/cuda/curand/index.html。
下面给出了通过GPU生成0.0到1.0之间(不包括0.0,包括1.0)服从均匀分布的单精度浮点伪随机数的CUDA程序。
#include <cuda.h> #include <curand.h> #define ERROR_EXIT -1 /* Check the return value of CUDA Runtime API */ #define CHECK_CUDA(err) do{ if((err) != cudaSuccess){ fprintf(stderr, "CUDA Runtime API error %d at file %s line %d: %s.\n", (int)(err), __FILE__, __LINE__, cudaGetErrorString((err))); exit(ERROR_EXIT); }}while(0) /* Check the return value of CURAND api. */ #define CHECK_CURAND(err) do{ if( (err) != CURAND_STATUS_SUCCESS ){ fprintf(stderr, "CURAND error %d at file %s line %d.\n", (int)(err), __FILE__, __LINE__); exit(ERROR_EXIT); }}while(0) /* Function: produce random float data by GPU * Input: dataHost: the memory to store data produced * number: the number of data to produce * seed: the seed for random generator * Output: void */ extern "C" void randomGenerator(float *dataHost, int number, unsigned long long seed) { float *dataDev; CHECK_CUDA( cudaMalloc( (void **) &dataDev, number * sizeof(float) ) ); curandGenerator_t gen; CHECK_CURAND( curandCreateGenerator(&gen, CURAND_RNG_PSEUDO_DEFAULT) ); CHECK_CURAND( curandSetPseudoRandomGeneratorSeed(gen, seed) ); CHECK_CURAND( curandGenerateUniform(gen, dataDev, number) ); CHECK_CURAND( curandDestroyGenerator(gen) ); CHECK_CUDA( cudaMemcpy(dataHost, dataDev, number * sizeof(float), cudaMemcpyDeviceToHost) ); CHECK_CUDA( cudaFree(dataDev) ); return; }
使用CURAND生成随机数需要注意以下几个问题:
1. 函数curandCreateGenerator()的第二个参数指定的是随机数生成器的类型,共有7种类型,分为伪随机数生成器和准随机数生成器两类。
2. 函数curandSetPseudoRandomGeneratorSeed()的第二个参数为随机数生成器指定种子,相同的种子将会生成相同的随机数序列。
3. 函数curandGenerateUniform()用于生成0.0到1.0之间(不包括0.0,包括1.0)服从均匀分布的单精度浮点数,共有8个类似的函数,分别用于生成服从不同分布的不同类型的随机数。另外一个比较常用的函数是curandGenerate(),用于生成unsigned int类型的随机数。
4. 在编译包含CURAND接口的文件时,需要添加指定链接库的编译选项-lcurand。
原文:http://blog.csdn.net/warren912/article/details/19962823