最近一直想面对大规模程序时,如何提高运算速度,100个怪物循环100次没有问题,但是处理的过程会特别庞大,所以考虑到使用多线程,unity的单线程,而unity自带的dots系统也不知道什么时候成熟,不想造轮子所以jobsystem真心不想用,在网上偶然间看到了一个关于鸟群算法对Computeshader的使用,查阅了很多资料后终于暂时入门:简单说就是在显卡上扣出一部分性能给游戏的数值做运算。
首先转载一张经典的图和某位原作者的话:
我自己的表述:
如果我们有一个长度为20的数组需要处理,为了同时处理者10000个数据,我们需要向显卡申请至少10000个线程,此时就可以申请10000个线程,但是呢这10000个线程太大了,所以呢,把这10000个线程的布局成一个2维数组,但是这个二位数组还是太大,所以呢就把这个二维数组再次切割成一个1维数组,这样整个表就切割成了一个3维数组;但是呢这个三维数组还是太大,以一个三维索引R范围为单元,再次按照上面的方法再切割成一个三维数组G,结果就是三维单元R就是numthreads(x,y,z),而三维数组G就是Dispatch(x,y,z)。这里也利于理解,因为显卡的处理单元过于庞大,已经超过了一个数组索引的范围,或者显卡的设计就是以层层阵列的方式制作的,因此这种超维度结构可以更好的索引到需要的资源,而它申请索引的时候完全是靠数字电路硬件获取(学过计算机电子的都知道)。
所以再次对上面的索引做出解释:
原文:https://www.cnblogs.com/xiaoahui/p/13703122.html